新手seo概念:爬行与索引的区别

  爬行和索引是seo的两个专业术语,当很多新手接触seo的时候,他们会将这两个词混合使用,认为爬行就是索引。今天笔者就和大家仔细讲述一些爬行好索引之间的区别是什么?

  1、爬行

  当搜索引擎蜘蛛在站点中发生爬行时,站点中有一个并且只有唯一一个url被抓取,搜索引擎可以从其他网页的链接跟踪爬行到这个站点中,所以对爬行的认识就是搜索引擎按照链接对站点特定的url进行抓取。

  可能上面的概念比较抽象,我们举例简单说明,比如说,在很多时候蜘蛛在爬行站点的时候,站点中的有些链接就不能被抓取,比如:

  (1)链接编码是Javascript,因为这被称为“蜘蛛陷阱”,爬行站点的时候,蜘蛛会自动屏蔽爬行这些链接。

  (2)链接被标记为robots.txt的 “禁止指令。

  (3)孤立的链接(没有人挂的情况下的sitemaps.xml,包括如链接)

  (4)链接所在的页面是一个包含链nofollow指令的页面

  (5)本来是要抓取的链接,但是因为服务器不稳定的原因无法进行抓取。

  2、索引

  索引和爬行最大的区别就是,索引不是一个特定的url被抓取,而是页面中的很多歌url,简单的说就是当搜索引擎确定好要索引哪个页面之后,它就会这个页面中的所有url进行处理和抓取,在抓取的过程中,蜘蛛会根据页面的内容进行适当的处理,举一个简单的例子,在有的页面内容中虽然存在一个url但这个url已经加上了NOINDEX指令,那么搜索引擎是不会抓取这个页面的。

  站点页面处于非索引状态的原因:

  (1)在页面中含有NOINDEX指令()

  (2)重复的内容:具有相同内容页面可能无法被索引。

  (3)其他原因:链接的年龄和链接流行

  如果新手想知道站点中的哪些页面已经被索引了,那么可以通过“site+网站域名”的方式检索,通过这样的方式,搜索引擎将会显示有多少个页面已经被蜘蛛所引并且是哪些页面。

  爬行和索引虽然表示的都是蜘蛛抓取站点,但他们所包含的方向是不一样的,这里笔者建议注意区分开。

  本文原创http://www.jiaodahaiwai.net 网站,首发A5网站,转载请保留有效的链接地址,谢谢!

时间: 2024-07-29 23:32:01

新手seo概念:爬行与索引的区别的相关文章

《SEO的艺术(原书第2版)》——2.2 基于算法的排名系统:爬行、索引和排名

2.2 基于算法的排名系统:爬行.索引和排名 理解爬行.索引和排名的工作原理,有助于SEO从业者确定达到目标所需要采取的措施.本节主要介绍Google和必应的运营方式,不一定适用于其他流行搜索引擎,例如,Yandex(俄罗斯).百度(中国).Seznam(捷克斯洛伐克)和Naver(韩国). 搜索引擎必须很好地执行几个任务,才能提供相关的搜索结果.简单地说,可以这样看待这些任务: 爬行和索引Web上的几十亿个文档(网页和文件).(注意,它们会忽略自己认为是"无价值"的网页,这可能是因为

减少无效URL的爬行和索引

,原因包括: 1.大量过滤条件页面内容重复或极为类似(大量复制内容将使网站整体质量下降) 2.大量过滤条件页面没有对应产品,页面无内容(如选择"100元以下42寸LED电视"之类的) 3.绝大部分过滤条件页面没有排名能力(排名能力比分类页面低得多)却浪费一定权重 4.这些过滤条件页面也不是产品页面收录的必要通道(产品页面应该有其它内链帮助爬行和收录) 5.爬行大量过滤条件页面极大浪费蜘蛛爬行时间,造成有用页面收录机会下降(过滤条件页面组合起来是巨量的) 那么怎样尽量使这些URL不被爬行

新手seo该如何把握网站内链建设

谈到seo,最近许多中小站长都混乱不已.绿萝算法.石榴算法接踵而至,让我们这些专职的seo人员应接不暇.不少新手和本人一样对眼前的链接建设很迷茫,都不知所措.百度如此抽风,究竟是什么原因?答案很明显--搜索引擎识破了那些靠作弊蒙混过关的seo优化伎俩,规规矩矩做站才是王道. 那新手seo该如何把握网站建设呢?在这几次百度更新的过程中,小编负责的网站排名也经历了过山车似的起伏.经过对这几次更新的观察,小编发现内链建设在百度算法中的地位越来越高,及时做好内链建设,对于网站的排名起着重要作用.小编看来

浅谈:新手seo优化为何屡屡失败

最近百度更新的越来越频繁了,有不少的网站都获得了较好的排名和收录情况,但是还是有一部分站长也遭到了百度的惩罚和降权,A5论坛上也可以看到许许多多的站长在抱怨为何自己建站做优化老是不见效果,为何我和别人是一样的优化手法区别为什么就这么大,所以今天就来和大家一起谈谈新手SEO优化为何屡屡失败的原因分析. 一.主关键字的错误选择 有很多站长在建站之前选择关键字的时候都没有做很详细的调查,导致做了几个月发现此关键字很难做到好的排名,原因是前面有不少的老站在竞争而且新站刚上线几个月整体的内容和权重都没有这

索引键的唯一性(1/4):堆表上的唯一与非唯一非聚集索引的区别

原文:索引键的唯一性(1/4):堆表上的唯一与非唯一非聚集索引的区别 在这篇文章里,我想详细介绍下SQL Server里唯一与非唯一非聚集索引的区别.看这个文章前,希望你已经理解了聚集和非聚集索引的概念,还有在SQL Server里是如何使用的. 很多人对唯一和非唯一索引非聚集索引的认识都不是很清晰.事实上,SQL Server在存储上这2类索引有着本质的区别,这些区别会影响到索引占用空间的大小和索引的使用效率. 今天我们从SQL Server里的堆表(Heap table) ,它是没有聚集索引

新手seo入门手册

 新手seo入门手册,什么才是真正意义上的seo?SEO这个行业前途在哪里?SEO需要掌握哪些基本技术及知识?4.如何才能迈出SEO的第一步?下面是一些新手朋友提出的相关seo网站优化的问题,我们下面就一一到讲解吧. 三.网站结构的优化,这是网站seo的前提所以我把它放在前面了.  ZAC文章的所说的网站物理结构与逻辑结构的概念,最优的情况是在网站的两种结构相吻合,如上图所示,也就是说: 1.主页链接向所有的频道主页; 2.主页一般不直接链接向内容页,除非是你非常想推的几个特殊的页; 3.所有频

避免蜘蛛爬行和索引错误的技巧:绕开冲突

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 正如你所知道的,你不能总是依赖蜘蛛引擎在访问或者索引你的网站时能够十分有效的运作.完全依靠他们自己的端口,蜘蛛会产生许多重复内容,把一些重要页面当成垃圾,索引本不应该展示给用户的链接入口,还会有其他的问题.有一些工具可以让我们能够充分控制蜘蛛在网站内部的活动,如meta robots标签,robots.txt.canonical标签等. 今天

网站优化必须要原创么 新手SEO更要注重理解

在网上看到过很多新手seo都在问,一个新站上线,该做什么,相信大多数的回答都是原创文章的更新.是的,不可否认,原创文章确实对网站很有益,但是,网 站优化,就必须要原创么?就必须在内容上一丝不苟,锱铢必较么?试问,一个网站有多少内容?少则几百上千,多着过百万千万.一个人,又能写出多少自己的思 想,自己的看法?所以,我觉得,在网站优化上,更加重要的是自己对网站优化的理解和领悟.只能说,原创确实是一个不错的方法,但是我希望的是,新手seo 们不要走进一个死胡同,更多的,还是要靠自己去发掘去领悟.下面是

新手SEO入行体会:网站内部建设优化的重要性

笔者在北漂的日子整天忙碌的选择工作,一次偶然的机会,接触到了seo这个行业,经过一哥们的引导,我加入了seo的队伍,至今已经三个月之久,首次在A5站长投稿,希望和大家分享一下我的新手seo入行体会之网站内部建设优化的重要性!Seoer最常说的一句话"内容为王,外链为皇",我对这个是非常认可的,但是经过我几个月的摸索,我发现另一个很重要的问题---网站内部建设优化! 用我的经历来说明我这个观点吧,我做的一个糖果屋摄影的网站,刚接触的时候我特别坚信"内容为王,外链为皇"