浅谈网站优化robots.txt文件的写法

  robots.txt文件,相比朋友们都或多或少的听说过,也可能自己已经写过了。其实到目前为止我本人还没写过robots.txt文件,不是不会写,只是感觉博客中没什么内容需要阻止蜘蛛抓取的。而且想必大家也知道一个个人独立博客中出现死链接的概率应该是非常小的,不需要过多的进行死链接处理所以我感觉没什么必要。但是robots.txt文件写法作为个人站长的必须掌握的技能之一,其用处还是很广泛的。这里就详细介绍下,也算是自己温习温习。

  什么是robots.txt文件

  我们从这个文件名来看,它是.txt后缀名的,大家也应该知道这是一个文本文件,也就是记事本。robots,懂点英语的人应该都人士,是机器人的意思,对我们而言这个机器人代表的就是搜索引擎机器人,从名字上就可以猜到这个文件是我们专门写给蜘蛛看的。它的作用就是告诉蜘蛛,那些栏目或者是那些页面不需要抓取,当然也可以直接屏蔽掉某个蜘蛛的访问。注意,这个文件是放在网站根目录下的,这样才能保证蜘蛛可以在第一时间读取文件内容。

  robots文件的作用

  其实robots文件最常被我们用到的就是屏蔽网站内的死链接。大家应该知道一个网站死链接多了会影响网站的权重。但是网站死链接清理虽然说不上是麻烦,还是需要花上不少时间的,特别是如果站内死链接较多的情况下,清理起来很费劲,这时候robots文件的用处就体现出来了,我们可以直接将这些死链接按照格式写入文件中阻止蜘蛛抓取,想清理的或以后在慢慢清理。有些网站内容中包含一些站长不想让蜘蛛抓取的url或文件,也可以直接屏蔽。对于屏蔽蜘蛛,用到的一般都比较少。

  robots文件的写法

  这一点应该是比较重要的了。如果写错了想屏蔽的没成功,想被抓取的却写进去自己不能及时发现可就亏大了。首先我们要知道两个标签,Allow和Disallow,一个是允许,一个是不允许,它的作用相比大家也都能理解。

  User-agent: *

  Disallow:

  或者

  User-agent: *

  Allow:

  这两段内容表示的都是允许抓取所有,实际上屏蔽url和文件用到的是Disallow标签,除非你的网站只有几条想要被抓取采用Allow标签。这个User-agent:后面跟的就是蜘蛛名称,大家对主流的搜索引擎蜘蛛名称应该比较熟悉。下面以搜搜蜘蛛为例:Sosospider。

  当我们想屏蔽搜搜蜘蛛的时候:

  User-agent: sosospider

  Disallow: /

  大家可以发现这个屏蔽蜘蛛跟上面允许相比只是多了一个“/”,其含义就起了翻天覆地的变化,所以在书写的时候要千万注意,可不能因为多写个斜杠屏蔽了蜘蛛自己却不知道。还有就是在user-agent:后边不屑固定蜘蛛名称跟的如果是“*”表示是针对所有蜘蛛的。

  禁止某个目录被搜索引擎蜘蛛抓取,设置代码如下:

  User-agent: *

  Disallow: /目录/

  注意,这里如果是阻止抓取某目录的话目录名字一定要注意“/”,不带“/”表示的是阻止访问这个目录页面和目录下的页面,而带上“/”则表示进阻止目录下的内容页面,这两点要分清楚。如果是想屏蔽多个目录就需要采用

  User-agent: *

  Disallow: /目录1/

  Disallow: /目录2/

  这样的形式,不能采用 /目录1/目录2/ 这样的形式。

  如果是阻止蜘蛛访问某一类型的文件,例如阻止抓取.jpg格式的图片可以设置成:

  User-agent: *

  Disallow: .jpg$

  以上是上海seo小马针对整个网站的robots文件的写法,只是讲的robots写法的类型和注意事项,像针对性屏蔽蜘蛛或者是其他的具体写法描述的少了点,但是知道allow和disallow的含义进行思考可以衍生出不少其他的写法含义。还有针对具体网页的robots meta网页标签写法,不过一般情况下用的不是很多。

  以上由上海seo小马http://www.mjlseo.com/整理,转载请注明,谢谢

时间: 2024-10-31 09:26:44

浅谈网站优化robots.txt文件的写法的相关文章

网站配置robots.txt文件供大家参考

robots文件是什么? 搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信息. 您可以在您的网站中创建一个纯文本文件robots.txt,在这个文件中声明该网站中不想被robot访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容.robots.txt文件放在哪里? robots.txt文件应该放在网站根目录下.举例来说,当robots访问一个网站(比如http://www.ithov.com)时,首先会检查该网

浅谈网站优化之seo排名必须掌控核心点

大家好,最近出了点事,一直在忙没有上网,所以没有分享文章,今天朱卫坤给大家带来另一个干货.写这篇文章,只是作为案例展现一下,希望朋友们可以通过文章学习更多的优化技巧.对于网站SEO优化接单来说,都是我们seo行业的一个过程,只要是想做优化,就一定有竞争的存在,如果简单的认为做好网站内容和外链就可以,那么就一直在三个月内关键词在50名后一直徘徊.只有深入分析竞争对手的相关数据,了解对手的优化技巧,做一个超越对手的计划安排,才能按照自己制定的时间超越竞争对手,让自己的优化的网站排名进入首页前5!今天

浅谈网站优化问题检测的顺序

你不得不相信网站优化问题的检测也是有顺序的,好的顺序能让我们快速的找出问题,去解决问题,可能您不遵循这个顺序也能找到问题,但是可能会走很多的弯路,其实每个行业或者说每个事情都有一定的规律,好的规律能让我们学习工作事半功倍,就像学习seo是的,我们先要会一些代码的知识,然后去学习结构.标题写法和如何建立外部链接等一系列知识,要是顺序倒了,那就会让学习很痛苦,耽误很多的时间.好了,下面我就简单说下这个顺序问题,上次我分析12月8日百度调整的政策的时候就是用的这个办法,结果三天就读过了难关. 第一:外

浅谈网站优化中的分块管理

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 做了一段时间网站优化工作,越来越感觉,其实可以把一个网站的优化工作分块来进行,特别是对于一些大中型的网站,不但要从整体上对其进行较好的把握,而且在细节上也要进行分块处理,那么优化工作要如何进行分块处理呢?下边来谈谈我的一些看法.其实搜索引擎在处理你的网页时,也是使用一定的方法来分块处理的,例如在提取正文的时候,它是把一些边框.一些公共栏目舍弃

浅谈网站优化的六个主要内容

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 谈起网站优化,大家往往会觉得没有什么可说的,就那么些内容.但实际上,网站优化是一个非常博大精深的课题.因为它牵涉到太多的学科领域,比如心理学.美学.计算机学.营销学.文学等等.因此,网站优化其实是很有讨论的空间的.小仁希望能在这里起到抛砖引玉的作用,引来更多的站长朋友都来深入地探讨网站优化的问题.只有这样,我们的网站事业才会更加繁荣.好了,这

浅谈网站优化三大策略

现在做百度优化是越来越不容易了.由于一些黑帽和链接买卖的盛行,最近的搜索引擎更新算法是越来越频繁了,如此更新之下许多网站都受到了不同程度的降权和减少收录.今天小李子和大家分享网站优化三大策略! 策略一:注重内容质量 现在百度对内容质量的要求已经非常的高了,一些伪原创的网站都很难获得较高的排名.而一些内容原创度高的新战却很受百度的亲昧而获得了首页较靠前的排名.这也许是百度想真正大大清理一番内容的时候了吧.所以建议大家做网站优化时尽量保持内容原创度.即使是伪原创,也要做到60%-80%的伪原创. 策

浅谈网站优化该如何做外链、内容

  当今激励的竞争市场,互联网猛速发展的趋势下,各行各业已意识到网络营销的重要性,随着网络营销被重视,SEO便犹如雨后春笋,满山遍野的发展,作为SEO工作者,我们应该认识到,行业之间在网络营销上竞争越是激励,就意味着我们的工作量越大.SEO的工作每一项都繁重琐碎,可谓是反复坚持着简单的事情,从中不断的学习和累积,其实更重要的是技巧和经验.说白了,理论一切都是纸上谈兵,实践之后方知成就. 对网站进行优化关键词排名,需要结合综合因素去考虑,大家都知道,网站构造,网站标题,空间稳定性,关键词等,这些设

浅谈网站优化如何内部布局

网站优化,内部布局很关键的环节,其流程:定位-选择合适的程序-内容的多少选择网站的结构-站内的每个功能利用seo元素,所以重点在于思路,站内优化应当由网站结构,站内链接出发思考. 一.网站结构 1.扁平式 这种结构比较合适内容比较少的网站,比如:博客.企业站等等,很多做单页优化,基本都是扁平式结构,有利于搜索引擎蜘蛛的抓取和收录.内容比较多的网站因为内容比较多,把网页生成静态在根目录下会很乱,同时也不好维护. 2.垂直式 垂直式(树形结构),这种结构比较内容比较多的网站,在根目录下分成多个栏目,

浅谈网站优化之四处一词

  笔者相信很多朋友都有自己的一套操作手法,但是一些常规的操作手法都大同小异的,很多新的手法的创新也是建立在常规优化的基础之上的.所以大家还是很有必要去了解一些常规的操作手法,从而更好的进行创新.但是这里笔者要强调的是不要违规即可,否则只能是昙花一现. 今天笔者要给大家介绍的是长尾词优化之四处一词,那么什么是四处一词呢?相信很多老鸟都已经知道了,但是这里还是给那些不知道的朋友解说下,老鸟的飘过.四处一次也就是我们常说的标题.关键字和描述.文章内容.锚文本,很多情况下,我们提到的四处一次主要是用来