欢迎访问零度网络,请记住我们的网址:www.ldukj.com
微信:HF96666
全国统一咨询热线
18351008282

优化爬行、抓取、索引、收录,指的都是什么?

作者:零度网络 发布于:2018-8-13 17:08:43 点击量:

1.爬行是什么?

爬行指的是搜索引擎蜘蛛从已知页面上解析出链接指向的URL,然后沿着链接发现新页面(也就是链接指向的URL)的过程。当然,蜘蛛并不是发现新URL马上就爬过去抓取新页面,而是把发现的URL存放到待抓地址库中,蜘蛛按照一定顺序从地址库中提取要抓取的URL。

2.抓取是什么?

抓取是搜索引擎蜘蛛从待抓地址库中提取要抓的URL,访问这个URL,把读取的HTML代码存入数据库。蜘蛛的抓取就是像浏览器一样打开这个页面,和用户浏览器访问一样,也会在服务器原始日志中留下记录。

3.索引是什么?

索引指的是将一个URL的信息进行整理,存入数据库,也就是索引库,用户搜索时,搜索引擎从索引库中提取URL信息并排序展现出来。索引的英文是index。索引库是用于搜索的,所以被索引的URL是可以被用户搜索到的,没有被索引的URL用户在搜索结果中是看不到的。

要注意的是,所谓“一个URL的信息“,并不限于蜘蛛从URL上抓取来的内容,还有其它来源的信息,如外部链接、链接的锚文字等。有时候,索引库中关于这个URL的信息,根本没有从这个URL抓取来的内容,但搜索引擎知道这个URL的存在,并且有一些其它的信息。抓取和索引并不相同。

4.收录是什么?

收录和索引几乎没有区别。只不过收录是从搜索用户角度看的,搜索时能找到这个URL,就是这个URL被收录了。从搜索引擎角度看,URL被收录了,也就是这个URL的信息在索引库中存在。英文并没有收录这个词,和索引用的是同一个词index。

    零度网络


上一篇:百度降权---百度搜索引擎8月份的见面礼-细雨算法发威

下一篇:没有了!

网站首页 关于我们 服务项目 精品案例 解决方案 新闻资讯 常见问题 联系我们

公司地址:南京市秦淮区石门坎104号

Copyright (c) 2018 Sincere All Rights Reserved.南京零度网络科技有限公司 技术支持:零度网站建设 苏ICP备18033188号

友情链接: 零度网络  南京百度公司 

统计