网站优化:robots.txt使用教程

 首先,我来介绍一下什么是robots.txt:robots.txt是搜索引擎中访问网站的时候要查 看的第一个文件。Robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是 否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有 被口令保护的页面。最后,robots.txt必须放置在一个站点的根目录下。

  大家可以参考一下谷歌、百度和腾讯的robots写法:

  http://www.google.com/robots.txt

  http://www.baidu.com/robots.txt

  http://www.qq.com/robots.txt

  大家了解完robots.txt后,那么我们可以用robots.txt来做什么?

  1、用robots.txt屏蔽相似度高的页面或没内容的页面。

  我们知道,搜索引擎收录网页后,会对网页进行“审核”,而当两个网页的相似度很高时,那么搜索引擎就会删除掉其中一个,并且会降低一点你网站的得分。

  假设以下这两个链接,内容其实差不多,那么第一个链接就应该屏蔽掉。

  /XXX?123

  /123.html

  像第一个的链接这样的链接非常多,那么我们要怎么屏蔽呢?其实只要屏蔽/XXX?就可以屏蔽所有的链接了。

  代码如下:

  Disallow: /XXX?

  同理,一些没有内容的页面我们也可以利用相同的办法将其屏蔽掉。

  2、用robots.txt屏蔽多余的链接,一般保留静态的链接(既HTML、htm、shtml等)。

  由于网站中经常会出现多个链接指向同一个页面的情况,而这样会让搜索引擎对网站的友好度降低。为了避免这一个情况,我们就可以通过robots.txt把 非主要的链接去掉。

  比如以下两个链接指向同样的页面:

  /OOO?123

  /123.html

  那么我们就应该去掉第一个垃圾,代码如下:

  Disallow: /OOO?123

  3、用robots.txt屏蔽死链

  死链就是曾经存在的网页,因为改版或其他原因而失去效用后就变成死链,也就是说看似一个正常的网页链接,但点击后不能打开相对应的网页页面。

  比如,原来在目录为/seo下的所有链接,因为目录地址的改变,现在都变成死链接了,那么我们可以用robots.txt把他屏蔽掉,代码如下:

  Disallow: /seo/

  4、告诉搜索引擎你的sitemap.xml地址

  利用robots.txt可以告诉搜索引擎你sitemap.xml文件的地址,而不需要在网站上添加sitemap.xml的链接。具体代码如下:

  Sitemap: 你的sitemap地址

  以上就是robots.txt的基本用法,一个好的网站必定会有一个好的robots.txt,因为robots.txt是搜索引擎了解你网站的一 个途径。另外在这里我推荐一下一个比较适合wordpress用户使用的robots.txt写法:

  User-agent: *

  Disallow: /wp-

  Disallow: /feed/

  Disallow: /comments/feed

  Disallow: /trackback/

  Sitemap: http://rainjer.com/sitemap.xml

  最后,如果你觉得上面所说的还不能满足你的需要,那么你可以在谷歌或百度官方提供的robots.txt使用指南学习:

  百度:http://www.baidu.com/search/robots.html

  谷歌:http://www.google.com/support/forum/p/webmasters/thread?tid=4dbbe5f3cd2f6a13&hl=zh-CN

时间: 2024-10-22 01:19:25

网站优化:robots.txt使用教程的相关文章

浅谈网站优化robots.txt文件的写法

robots.txt文件,相比朋友们都或多或少的听说过,也可能自己已经写过了.其实到目前为止我本人还没写过robots.txt文件,不是不会写,只是感觉博客中没什么内容需要阻止蜘蛛抓取的.而且想必大家也知道一个个人独立博客中出现死链接的概率应该是非常小的,不需要过多的进行死链接处理所以我感觉没什么必要.但是robots.txt文件写法作为个人站长的必须掌握的技能之一,其用处还是很广泛的.这里就详细介绍下,也算是自己温习温习. 什么是robots.txt文件 我们从这个文件名来看,它是.txt后缀

优化Robots.txt:扬己之长避己之短

Robots.txt文件是一个简单的TXT文本,但是专注网站建设及网站优化的Seoer们都清楚它的重要性,它的存在可以将不希望搜索引擎抓取的页面屏蔽起来,也可以像是一张地图一样为蜘蛛引路指航.当蜘蛛爬行到一个站点时,首先访问的便是是否存在Robots.txt文件,然后按照内容中的指引来进行索引访问,如果文件不存在的话那么就按照页面中的链接进行顺序的访问.因此我们可以利用它来屏蔽一些不需要搜索引擎要索引的目录,或者将网站地图在Robots.txt中描述引导蜘蛛爬行,这样对于网站安全性上或者节省服务

网站配置robots.txt文件供大家参考

robots文件是什么? 搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信息. 您可以在您的网站中创建一个纯文本文件robots.txt,在这个文件中声明该网站中不想被robot访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容.robots.txt文件放在哪里? robots.txt文件应该放在网站根目录下.举例来说,当robots访问一个网站(比如http://www.ithov.com)时,首先会检查该网

robots.txt使用教程

Robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的.当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是 否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有 被口令保护的页面.最后,robots.txt必须放置在一个站点的根目录下. 大家可以参考一下谷歌.百度和腾讯的robots写法: http://www.google.com/robots.txt http://www.bai

新手交流:网站优化基础知识文字教程普及

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 老板们总是希望自己的网站关键词可以在百度里达到首页的位置.甚至他们根本不关心你会用何种手法,只要出现排名,他们就会很高兴 .我接触过一个老板,当时他来找我帮他们网站做优化.我问他想通过优化达到一个怎样的心理预期.他说我想在百度里搜索我们的名字,可以轻松地找到我们网站.我心里在想,如此简单,心理窃喜.其实,老板会这样去说的原因是因为老板不懂,但

两个方法检查网站robots.txt是否合理

看了很多网站优化的文章,都很少提及如何检查网站的robots.txt,大多就说明一下robots.txt要设置好.对于高手来讲,这是小菜一碟,可以轻松判断robots.txt是否合理,但对于一些菜鸟来讲,根本无法判断自己网站的robots.txt是否合理,一个错误的robots.txt文件会使搜索引擎机器无法挖掘你的网站,其结果是你的新内容无法列举在搜索引擎的索引中.这对网站站长来说是一个巨大的损坏.如果你做错了什么并重新编辑 robots.txt文件的话,它需要两个星期才能看到效果.因此一个正

什么是robots.txt?_网站运营

robots.txt 文件对抓取网络的搜索引擎漫游器(称为漫游器)进行限制.这些漫游器是自动的,在其访问网页前会查看是否存在阻止其访问特定网页的 robots.txt 文件. 如何创建 robots.txt 文件? 可以在任何文本编辑器中创建此文件.该文件应为 ASCII 编码的文本文件,而非 HTML 文件.文件名应使用小写字母. 语法最简单的 robots.txt 文件使用两条规则: User-Agent:适用下列规则的漫游器 Disallow:要拦截的网页 这两行被视为文件中的一个条目.您

网站robots.txt文件配置错误,让我的站点丧失抓起良机!

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 国外的检查robots.txt文件合法性的在线验证工具地址是:http://tool.motoricerca.info/robots-checker.phtml.不过要注意,使用这个工具,请把robots.txt里的汉字注释清除(我的广州空调维修站点就是吃这个亏了!!!),它识别不了汉字:如果有汉字在里面的话,它就不认为这是一个robots.

细节决定成败:从图片入手做好网站优化

大家好,初入seo行业的朋友们可能普遍认为:网站优化就是简单的外链建设与内链优化.固然,这两点在网站优化的过程中是起到了重要作用,但是试想,如果一个网站上全部都是文字而没有图片,那岂不是显得过为单调?那么,今天就跟大家探讨一下如何从网站的图片入手做好seo优化.有朋友可能会质疑了,图片的优化属于细枝末节,对于优化起到的作用也是微乎其微.好,既然有如此质疑,那么我们不妨先上一张流量统计截图,我们用事实说话:   我们的最科技网站相信A5的朋友应该都比较熟悉了,以前我们也是拿这个网站作为案例讲解的如