从零基础开始学习好SEO
当前位置: 首页 > 第3节:爬虫的正确认知

第3节:爬虫的正确认知

发布时间:2021年4月25日 20:29:18

视频简介(下面内容为音频转文字)

欢迎大家收听我课程。我是高一老师,请不要跳过每一节课,因为每一节课能都是九年的这种精华的。经验啊,那么我们来讲一下。认知,搜索引擎爬虫啊,我们在上一节课呢,我们就讲到了。收集对不对?那么百度呢?他是如何来收集这个页面的呢?他其实他有一个专门的程序给他提供收集啊,那么我们来举个例子啊,比如说,哎,这个是百度。是吧?

那百度呢他有一个工人啊,那比如说这个圆圈的,就是这个页面啊。打这个呢?他有一个爬虫。啊,就是他也是个软件来的啊,他名字叫爬虫而已啊,那么这个爬虫的专门的去。收集对专门的,去收集这页面,收集回来之后就提供给这个百度啊这个大佬。

百的这个是爬ok啊,说的很简单。百度呢?它就有一个。这个小软件对吧?对?他叫爬虫,专门的去爬网页的对就是他是独立工作的。独立的去爬去啊,不断的爬爬爬爬爬是吧。爬了之后呢,然后提供给百度,是吧?所以呢,这个叫做爬虫是吧?那么同样的,他还有一个名字呢,叫做蜘蛛,蜘蛛啊。为什么叫蜘蛛呢?是因为啊,互联网就像一张网一样嘛。他在上面啪啪啪啪的。所以呢,给他起了一个名字,叫做蜘蛛,所以呢,每一个搜索引擎啊。他都有他自己的这个蜘蛛啊,而且都有他独有的名称而都是英文啊百度失败的。打goodbye。

360失败的啊。首先呢,我个人来说本身我也并不是特别的熟悉英语啊,英语特别的差。那么大家如果说你也不懂得英语,那怎么办呢?你只要认得前面的这些字母就可以了,百度拼音百度看到没有谷歌,360。很好认,对不对如果你实在呢,想要知道每一个蜘蛛的名称,那么你可以百度一下。搜索引擎制作的名字都有哪些?然后下面就会有很多。

是不是好啊?所以这些东西的话本身呢,也。不需要特意的去记他啊,你需要去理解,他有这个一个东西的存在啊。我们下节课不会讲到这个爬虫的规则,爬虫它的作用的话,相信呢?大家也很清楚了,那就是抓取页面啊。严格的来说是,下载。对啊,呃,访问啊,访问啊就是本质呢?是下载就是访问页面。是吧。请记住啊,搜索引擎就是蜘蛛。他是互联网的一个普通访客。什么意思呢?就是这个制作和我们人打开网页是一模一样的。因为呢?如果说我们人打得开,那这个蜘蛛呢?他也可以。那如果我们人。反问不了这个网页啊,那蜘蛛它也反问不了的。就是本质是一样的,我们用浏览器能打开一个网页是吧?你还比如说,我们用这个浏览器打开一个网页。是吧,其实我们是把那个浏览器的,通过浏览器啊把网页的下载到了我们的本地嘛?对不对?

那么蜘蛛,它也是如此的,它第一个作用呢,就是访问,第二个作用呢就是回访,呵呵。对,就是有一些老页面啊,他自己呢,会有一个规则。然后呢,会回访一些老的页面,当然了,这个爬虫它也是有自己的规则的,哈,我们下节课会讲到爬龙的规则。

 
   

教程列表

©2021 本网站创建与2021年。致力打造从零开始SEO学习网,高清seo视频教你轻松学习搜索引擎优化怎么做,教你真正做到独立优化网站。