网站优化：robots.txt使用教程

　首先，我来介绍一下什么是robots.txt：robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。Robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。当一个搜索蜘蛛访问一个站点时，它会首先检查该站点根目录下是否存在robots.txt，如果存在，搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在，所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。最后，robots.txt必须放置在一个站点的根目录下。

　　大家可以参考一下谷歌、百度和腾讯的robots写法：

　　http://www.google.com/robots.txt

　　http://www.baidu.com/robots.txt

　　http://www.qq.com/robots.txt

　　大家了解完robots.txt后，那么我们可以用robots.txt来做什么?

　　1、用robots.txt屏蔽相似度高的页面或没内容的页面。

　　我们知道，搜索引擎收录网页后，会对网页进行“审核”，而当两个网页的相似度很高时，那么搜索引擎就会删除掉其中一个，并且会降低一点你网站的得分。

　　假设以下这两个链接，内容其实差不多，那么第一个链接就应该屏蔽掉。

　　/XXX?123

　　/123.html

　　像第一个的链接这样的链接非常多，那么我们要怎么屏蔽呢?其实只要屏蔽/XXX?就可以屏蔽所有的链接了。

　　代码如下：

　　Disallow： /XXX?

　　同理，一些没有内容的页面我们也可以利用相同的办法将其屏蔽掉。

　　2、用robots.txt屏蔽多余的链接，一般保留静态的链接(既HTML、htm、shtml等)。

　　由于网站中经常会出现多个链接指向同一个页面的情况，而这样会让搜索引擎对网站的友好度降低。为了避免这一个情况，我们就可以通过robots.txt把非主要的链接去掉。

　　比如以下两个链接指向同样的页面：

　　/OOO?123

　　/123.html

　　那么我们就应该去掉第一个垃圾，代码如下：

　　Disallow： /OOO?123

　　3、用robots.txt屏蔽死链

　　死链就是曾经存在的网页，因为改版或其他原因而失去效用后就变成死链，也就是说看似一个正常的网页链接，但点击后不能打开相对应的网页页面。

　　比如，原来在目录为/seo下的所有链接，因为目录地址的改变，现在都变成死链接了，那么我们可以用robots.txt把他屏蔽掉，代码如下：

　　Disallow： /seo/

　　4、告诉搜索引擎你的sitemap.xml地址

　　利用robots.txt可以告诉搜索引擎你sitemap.xml文件的地址，而不需要在网站上添加sitemap.xml的链接。具体代码如下：

　　Sitemap：你的sitemap地址

　　以上就是robots.txt的基本用法，一个好的网站必定会有一个好的robots.txt，因为robots.txt是搜索引擎了解你网站的一个途径。另外在这里我推荐一下一个比较适合wordpress用户使用的robots.txt写法：

　　User-agent： *

　　Disallow： /wp-

　　Disallow： /feed/

　　Disallow： /comments/feed

　　Disallow： /trackback/

　　Sitemap： http://rainjer.com/sitemap.xml

　　最后，如果你觉得上面所说的还不能满足你的需要，那么你可以在谷歌或百度官方提供的robots.txt使用指南学习：

　　百度：http://www.baidu.com/search/robots.html

　　谷歌：http://www.google.com/support/forum/p/webmasters/thread?tid=4dbbe5f3cd2f6a13&hl=zh-CN

时间： 2024-12-26 18:29:31

网站优化：robots.txt使用教程的相关文章

浅谈网站优化robots.txt文件的写法

robots.txt文件,相比朋友们都或多或少的听说过,也可能自己已经写过了.其实到目前为止我本人还没写过robots.txt文件,不是不会写,只是感觉博客中没什么内容需要阻止蜘蛛抓取的.而且想必大家也知道一个个人独立博客中出现死链接的概率应该是非常小的,不需要过多的进行死链接处理所以我感觉没什么必要.但是robots.txt文件写法作为个人站长的必须掌握的技能之一,其用处还是很广泛的.这里就详细介绍下,也算是自己温习温习. 什么是robots.txt文件我们从这个文件名来看,它是.txt后缀

优化Robots.txt：扬己之长避己之短

Robots.txt文件是一个简单的TXT文本,但是专注网站建设及网站优化的Seoer们都清楚它的重要性,它的存在可以将不希望搜索引擎抓取的页面屏蔽起来,也可以像是一张地图一样为蜘蛛引路指航.当蜘蛛爬行到一个站点时,首先访问的便是是否存在Robots.txt文件,然后按照内容中的指引来进行索引访问,如果文件不存在的话那么就按照页面中的链接进行顺序的访问.因此我们可以利用它来屏蔽一些不需要搜索引擎要索引的目录,或者将网站地图在Robots.txt中描述引导蜘蛛爬行,这样对于网站安全性上或者节省服务

网站配置robots.txt文件供大家参考

robots文件是什么? 搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信息. 您可以在您的网站中创建一个纯文本文件robots.txt,在这个文件中声明该网站中不想被robot访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容.robots.txt文件放在哪里? robots.txt文件应该放在网站根目录下.举例来说,当robots访问一个网站(比如http://www.ithov.com)时,首先会检查该网

robots.txt使用教程

Robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的.当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面.最后,robots.txt必须放置在一个站点的根目录下. 大家可以参考一下谷歌.百度和腾讯的robots写法: http://www.google.com/robots.txt http://www.bai

新手交流：网站优化基础知识文字教程普及

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅老板们总是希望自己的网站关键词可以在百度里达到首页的位置.甚至他们根本不关心你会用何种手法,只要出现排名,他们就会很高兴 .我接触过一个老板,当时他来找我帮他们网站做优化.我问他想通过优化达到一个怎样的心理预期.他说我想在百度里搜索我们的名字,可以轻松地找到我们网站.我心里在想,如此简单,心理窃喜.其实,老板会这样去说的原因是因为老板不懂,但

两个方法检查网站robots.txt是否合理

看了很多网站优化的文章,都很少提及如何检查网站的robots.txt,大多就说明一下robots.txt要设置好.对于高手来讲,这是小菜一碟,可以轻松判断robots.txt是否合理,但对于一些菜鸟来讲,根本无法判断自己网站的robots.txt是否合理,一个错误的robots.txt文件会使搜索引擎机器无法挖掘你的网站,其结果是你的新内容无法列举在搜索引擎的索引中.这对网站站长来说是一个巨大的损坏.如果你做错了什么并重新编辑 robots.txt文件的话,它需要两个星期才能看到效果.因此一个正

什么是robots.txt?_网站运营

robots.txt 文件对抓取网络的搜索引擎漫游器(称为漫游器)进行限制.这些漫游器是自动的,在其访问网页前会查看是否存在阻止其访问特定网页的 robots.txt 文件. 如何创建 robots.txt 文件? 可以在任何文本编辑器中创建此文件.该文件应为 ASCII 编码的文本文件,而非 HTML 文件.文件名应使用小写字母. 语法最简单的 robots.txt 文件使用两条规则: User-Agent:适用下列规则的漫游器 Disallow:要拦截的网页这两行被视为文件中的一个条目.您

网站robots.txt文件配置错误，让我的站点丧失抓起良机！

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅国外的检查robots.txt文件合法性的在线验证工具地址是:http://tool.motoricerca.info/robots-checker.phtml.不过要注意,使用这个工具,请把robots.txt里的汉字注释清除(我的广州空调维修站点就是吃这个亏了!!!),它识别不了汉字:如果有汉字在里面的话,它就不认为这是一个robots.

细节决定成败：从图片入手做好网站优化

大家好,初入seo行业的朋友们可能普遍认为:网站优化就是简单的外链建设与内链优化.固然,这两点在网站优化的过程中是起到了重要作用,但是试想,如果一个网站上全部都是文字而没有图片,那岂不是显得过为单调?那么,今天就跟大家探讨一下如何从网站的图片入手做好seo优化.有朋友可能会质疑了,图片的优化属于细枝末节,对于优化起到的作用也是微乎其微.好,既然有如此质疑,那么我们不妨先上一张流量统计截图,我们用事实说话: 我们的最科技网站相信A5的朋友应该都比较熟悉了,以前我们也是拿这个网站作为案例讲解的如

猜你喜欢

V5Shop分享一个独立网店快速提升PR和销售额的方法

V5Shop分享一个独立网店快速提升PR和销售额的方法很多独立网店的店主都在为宣传推广头疼.在现在这个产品丰富的市场经济环境下,各行各业的竞争都异常激烈,"酒香也怕巷子深"已经成 ...

Hibernate对多表关联查询

由于公司项目的需要,我对Hibernate对多表关联查询研究了一下,现总结如下,供朋友参考. 一. Hibernate简介Hibernate是一个JDO工具.它的工作原理是通过文件(一般有两种:xml ...

用Fireworks制作动态效果的LOGO

动态本例主要针对一个LOGO的渐隐效果做出仔细讲解本例涵盖了FW所有的主要动画技巧对初学者来说可能有点难,但只要仔细揣摩,那么用fw做gif就可以完全掌握 1,新建一个88*31的画布,画出如图 ...

使用Publish/Subscribe 设计模式达到对象间数据同步(二)

对象|设计|数据|数据同步在注册处理期间,subscriber被分配一个独特的标记,用来在event channel中标识subscriber.event channel也使用这个标记索引那些sub ...

百度上线新浪微博实时搜索给互联网带来哪些变化

Admin5站长网消息,3月1日晚,百度整合新浪微博内容的实时搜索服务上线.百度在其搜索结果中实时显示与关键词相关的最新新浪微博内容.这是新浪微博首次和第三方搜索引擎合作.站长网编辑发现,新浪微博页面 ...

商业智能三步走：报表分析挖掘

经过几年的积累,大部分中大型的企事业单位已经建立了比较完善的CRM.ERP.OA等基础信息化系统.这些系统的统一特点都是:通过业务人员或者用户的操作,最终对数据库进行增加.修改.删除等操作.上述系统可 ...

ADO.NET Entity Framework(2)建模

目录 1 模型结构 1 1.1 模型关系说明 1 1.2 模型设计器结构说明 2 2 EDM 3 2.1 Model设计器 3 2.2 edmx文件 4 2.3 Context 5 2.4 实体类 5 ...

Android Manifest.xml文件详解

AndroidManifest.xml文件是Android系统重要的权限申请和定义配置文件,程序员在开发时需要通过其来向系统预先定义和申请应用程序运行所需要的权限.灵活.安全地使用该配置文件是Andr ...

WinXP系统如何设置msconfig

设置方法: 1.点击"开始"-"运行"(或者Win+R键),输入msconfig. 2.点击"一般"-选择"有选择的启动&qu ...

Win7放大镜的功能与运用

对于很多WIN7系统的电脑新用户来说,还不知道win7放大镜功能在哪怎么用?其实Win7系统中有很多的新颖小功能是之前使用的WinXP不具有的,而这些小功能恰好能有效提升用户体验,增强系统功能,因此也 ...

傲游浏览器3的在线收藏功能怎么使用

傲游3的在线收藏功能使用方法. 首先你需要一个傲游账户. 第二,运行傲游3.0后,点击界面左上角的头像按钮,在登录框中输入你的用户名和密码后,点击"登录"后即可登录你的傲游账户 ...

photoshop怎么修改临时文件存放位置

方法一:编辑--受选项--性能方法二:快捷键,"ctrl"+"K".选择属性暂存盘.选择好点击确定分类: PS入门教程

删除Linux后要找回Windows启动菜单怎么做

删除Linux之后,Linux的LILO却仍旧留在系统之中,使得机器启动的第一个界面不能回到选择Windows的菜单. 本文要告诉你解决的方法: 随着Linux的影响越来越广泛,许多电脑爱好者也开始 ...

电脑上网历史记录清除方法

IE浏览器删除历史记录方法/步骤第1步:打开浏览器,单击"工具"下的"Internet选项". 第2步:单击浏览历史记录下的"删除"按 ...

JavaScript高级程序设计（第3版）学习笔记12 js正则表达式_基础知识

需要指出的是,这里只是总结了正则表达式的常用的且比较简单的语法,而不是全部语法,在我看来,掌握了这些常用语法,已经足够应对日常应用了.正则表达式不只是应用在ECMAScript中,在JAVA..Net ...

JavaScript中typeof知多少？

typeof运算符介绍:typeof 是一个一元运算,放在一个运算数之前,运算数可以是任意类型.它返回值是一个字符串,该字符串说明运算数的类型. 你知道下面typeof运算的结果吗? typeof ...

extjs4-ExtJs4的内存问题。。

问题描述 ExtJs4的内存问题.. 用EXT4.1开发的系统刷新时候在IE中内存不降低,火狐没事,这是什么原因?

activity-菜单按钮不能运行的问题

问题描述菜单按钮不能运行的问题菜单上有6个按钮,按钮可以显示但是不能调用activity,在菜单按钮上看不到显示任何文本,出现空白,请大家帮我看看出现什么问题了. package com.cere ...

WebSphere应用服务器(WAS)管理与应用

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;WebSphere应用服务器(WAS)是因特网的基础架构软件 ...

《Arduino开发实战指南：LabVIEW卷》——2.1　Arduino IDE

2.1 Arduino IDE 2.1.1 Arduino IDE界面双击Arduino应用软件的执行文件arduino.exe,打开Arduino开发环境. Arduino开发环境包含一个用于写代 ...

EDAS带你快速搞定分布式应用

[EDAS最近更新] 2.13.1 版本:提供对本地方法执行追踪: 支持租户内服务鉴权与授权. 2.13.0 版本:Http流量管理功能上线,提供了对应用运行时线程堆栈和内存分布的查看. 2.12.3 ...

网游分级并非允许成年人玩色情游戏

"未加限制的网络游戏.刺激的黄色信息,极易损害青少年的身心健康."昨日,湖北省政协委员.宜昌市团委书记宋涛提议,应制定网络游戏分级标准,降低青少年网络成瘾的比例. 宋涛表示,通过调 ...

sql server-JS 连接 SQL SERVER 数据库点了没有任何反应，也不报错。

问题描述 JS 连接 SQL SERVER 数据库点了没有任何反应,也不报错. //连接数据库 function getConnection(){ var user = document.getEl ...

新加坡强国之梦：以大数据为基石，建筑智能之国

在过去的半个多世纪里,李光耀成功的把一个落后的第三世界的小岛国建设成一个世界上一流的国家,使新加坡成为国际金融和技术中心,开创了享誉亚洲的新加坡模式.如今,李光耀时代正式落下帷幕,新加坡将何去何从?今 ...

深入剖析MFC中对于Windows消息处理、运行机制

序: 本人对Windows系统.MFC谈不上有深入的了解,但对MFC本身包装API的机制很有兴趣,特别是读了候老师的<深入浅出MFC>后,感觉到VISUAL C++的Appl ...

王菲秘密到港为演唱会彩排妆容将有新尝试

王菲这次有多款演唱服装,肯定有看头新浪娱乐讯北京时间3月3日消息,据香港媒体报道,香港歌迷久违了的王菲,即将可以重温她亲自演绎的经典广东歌曲,王菲的2011巡唱香港站将于明天亚洲博览馆展开五场的演 ...

传统行业借力电子商务快速发展

根据中国电子商务研究中心近日发布的<2010年度中国行业电子商务网站调查报告>显示,截止到2010年12月,我国行业电子商务服务企业达9200家, 同比增长21.3%,2010年我国电子商 ...

低成本企业品牌塔式服务器对比分析

塔式服务器应该是大家见得最多,也最容易理解的一种服务器结构类型,因为它的外形以及结构都跟我们平时使用的立式PC 差不多,当然,由于服务器的主板扩展性较强.插槽也多出一堆, 所以个头比普通主板大一些,因 ...

网站被K或者排名下降背后的因素有哪些

很多站长都参加了讨论,有些人说是因为十八大要召开的原因,互联网管理的比较严格.貌似我们从事SEO的和十八大八竿子都到不了一起. 也有站长说,是因为算法变动了,所以他们所在的行业就处于变动,不可能行业算 ...

光伏应用将可能达到一个“临界点”

导读:未来的20年间,可再生能源将可能占到全球能源供应增长的半壁江山.平价上网的临界点如果突破,可再生能源成为主力能源的时代将到来. 与所有正常商品一样,对于能源商品而言,消费者同样追求物美价廉.在人 ...

热搜