Robots.txt写法详解及注意事项

  之前由写过“Robots“标签与robots.txt区别只是简单的对robots.txt作了下介绍,这里武汉seo闲人为大家详细的介绍下robots.txt写法详解及注意事项。

  一、robots.txt是干什么用的

  

  robots.txt写法详解及注意事项

  一个网站中有很多个文件,其中包含了后台程序文件、前台模板文件、图片等等。这之中有一些东西我们是不希望被百度蜘蛛抓取的,怎么办呢?搜索程序考 虑到了这一点,蜘蛛在抓取网站页面之前会先访问网站根目录下的robots.txt文件,如果此文件存在那么按照robots.txt限定的范围进行抓 取,如果不存在,则默认为可以抓取全部。

  二、robots.txt在seo中在作用

  前一篇文章“度娘无视robots.txt文件的存在” 中我们可以看到,百度一个页面抓取的两个网址,这样会分散网页的权重,如果我们写好robots.txt就可以避免这样的情况产生。robots.txt 在seo中在作用就是屏蔽不必要的页面抓取,为有效页面赢得蜘蛛抓取的机会。由于屏蔽不必要页面抓取从而可以页面权重,节省网络资源;最后我们可以将网站 地图放在里面,方便蜘蛛抓取网页。

  三、哪些文件是可以用robots.txt屏蔽的

  网页中的模板文件、样式表文件以及后台的某些文件即使呗搜索引擎抓取了也没什么作用,反而是浪费网站资源,这类文件可以屏蔽;如果网页中的某些特定页面比如联系我们、公司内部某些不需要公开的照片这些都可以根据实际情况进行屏蔽。

  四、robots.txt写法详解及注意事项

  以主机博客为例,robots.txt文件如下:

  User-agent:* //允许所有搜索引擎蜘蛛抓取 Disallow:/wp- //不允许抓取url中带wp-的网址 Allow:/wp-content/uploads/ //允许抓取wp-content/uploads/目录下的文件

  Disallow:/*?* //不允许抓取url中带?的网址 Disallow:/feed Disallow: /trackback Disallow: /index.php? Disallow: /*.php$ //不允许抓取url中以.php结尾的网址 Disallow: /*.css$ Disallow: /date/ Sitemap: http://www.chenhaoseo.com/sitemap.xml //网站地图 Sitemap: http://www.chenhaoseo.com/sitemap_baidu.xml

  User-agent:*这样的记录只能有一条。*代表所有引擎蜘蛛,如果仅仅只针对某个搜索引擎可以这样写果User-agent:Baiduspider表示只下面规则都是针对百度蜘蛛的。

  Disallow: 描述不需要被索引的网址或者是目录。比如Disallow:/wp-不允许抓取url中带wp-的网址;要注意的是Disallow: /date/与Disallow: /date是不一样的;前者仅仅是不允许抓取date目录下的网址,如果data目录下还有子文件夹,那么子目录是允许抓取的,后者可以屏蔽date目录 下所有文件,包括起子文件夹。

  Allow:描述不需要被索引的网址或者是目录。功能跟disallow相反,特别注意的是Disallow与Allow行的顺序是有意义的,robot会根据第一个匹配成功的Allow或Disallow行确定是否访问某个URL。

  使用”*”和”$”:Baiduspider支持使用通配符”*”和”$”来模糊匹配url。”$” 匹配行结束符。”*” 匹配0或多个任意字符。

  robots.txt写法详解及注意事项就写到这里,如果你写完之后感觉有疑问,你可以用谷歌管理员工具进行测试,确保robots.txt书写正确这样才能起到效果。本文由武汉seo闲人 原创http://www.chenhaoseo.com seo技术交流QQ94775541

时间: 2024-11-18 17:20:38

Robots.txt写法详解及注意事项的相关文章

Robots.txt 协议详解及使用说明

一.Robots.txt协议 Robots协议,也称为爬虫协议.机器人协议等,其全称为"网络爬虫排除标准(Robots Exclusion Protocol)".网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取.也既是Robots的用法有两种,一种是告诉搜索引擎哪些页面你不能抓(默认其他的就可以抓):一种是告诉搜索引擎你只能抓取哪些页面(默认其他的不可以抓).   当一个搜索机器人(蜘蛛)访问一个站点时,它会首先检查网站根目录下是否存在robots.txt,如果存

Python中使用不同编码读写txt文件详解

  这篇文章主要介绍了Python中使用不同编码读写txt文件详解,本文给出不同编码下的读写文件代码方法,需要的朋友可以参考下 代码如下: import os import codecs filenames=os.listdir(os.getcwd()) out=file("name.txt","w") for filename in filenames: out.write(filename.decode("gb2312").encode(&q

robots txt 写法-robots.txt 写法 robots.txt 写法

问题描述 robots.txt 写法 robots.txt 写法 User-agent: * Allow:/html/ allow:/index.php$ allow:/index.html$ Disallow:/ 以上只收录html和首页,这样写对吗 解决方案 SEO 必备--robots.txt写法robots.txt的详细写法实例分析Robots.txt写法 解决方案二: 嗯,应该是对的,具体的写法可以去参考百度开发者网站上的,里面有各种详细的配置 解决方案三: $表示匹配后面任意字符.h

js事件源window.event.srcElement兼容性写法(详解)_javascript技巧

如下所示: <html> <body> <p>一个好处就是 我想让body(或其他元素内)的某些对象响应事件 就不用挨个儿去写 只要在外层上写一个 然后检查event.srcElement.tagName或其他属性是不是你想要的来决定是否响应事件就可以了.不过好像event.srcElement在ff里不起作用 </p> <p>比如</p> <p> <input value="input">

YII框架中搜索分页jQuery写法详解_php实例

控制层 use frontend\models\StudUser; use yii\data\Pagination; use yii\db\Query; /** * 查询 * */ public function actionSearch() { //接值 $where=Yii::$app->request->get(); //实例化query $query=new Query(); $query->from('stud_user'); //判断 if(isset($where['sex

ListView嵌套GridView使用详解及注意事项_Android

MainActivity如下: 复制代码 代码如下: package cn.testlistviewandgridview; import java.util.ArrayList; import java.util.HashMap; import android.app.Activity; import android.os.Bundle; import android.widget.ListView; /** * Demo描述: * ListView嵌套GridView使用详解 * 即List

ListView嵌套GridView使用详解及注意事项

MainActivity如下: 复制代码 代码如下: package cn.testlistviewandgridview; import java.util.ArrayList; import java.util.HashMap; import android.app.Activity; import android.os.Bundle; import android.widget.ListView; /** * Demo描述: * ListView嵌套GridView使用详解 * 即List

php引用(&amp;amp;)详解及注意事项

PHP的引用(就是在变量或函数或对象或对象方法 等前面加上&符号) 在PHP 中引用的意思是:不同的名字访问同一个变量内容. 与C语言中的指针是有差别的.C语言中的指针里面存储的是变量的内容,在内存中存放的地址. 1.变量的引用 PHP 的引用允许你用两个变量来指向同一个内容. <? $a = "ABC"; $b = &$a; echo $a; //这里输出:ABC echo $b; //这里输出:ABC $b = "EFG"; echo $a

Flex布局新旧混合写法详解(兼容微信)

flex是个非常好用的属性,如果说有什么可以完全代替 float 和 position ,那么肯定是非它莫属了(虽然现在还有很多不支持 flex 的浏览器).然而国内很多浏览器对 Flex 的支持都不是很好,这里针对微信内置浏览器写了一套兼容写法.下面入正题. 首先还是从两个版本的语法开始讲吧,这里还是假设flex容器为 .box ,子元素为 .item . 旧语法篇 定义容器的display属性 .box{        display: -moz-box; /*Firefox*/