Robots.txt的写法和利用百度站长平台工具自动生成

  百度站长平台提供了一个很好的robots.txt自动生成工具,利用它我们可以很方便的写出robots.txt,通过robots.txt阻止搜索引擎收录你不想要被收录的页面及目录,还可以阻止及引导蜘蛛爬行更多的页面,减少蜘蛛的爬行量,提高蜘蛛的爬行效率,有效的提升更多的页面被收录。

  前面我们介绍了通过IIS日志分析让你更好的了解网站运行情况,可以通过IIS日志查询到蜘蛛爬行中返回404状态的页面,这里我们可以用robots.txt禁止蜘蛛爬行。百度站长平台注册及网站验证方法这里就不说了,下面讲讲Robots工具的使用方法:

  通过上图可以看到,蜘蛛返回404状态的页面都是网站改版前使用的网址,现在都不存在了,但是搜索引擎数据库还保存有记录,所以每天蜘蛛还是会来抓取这个页面的数据的,还有的时候是蜘蛛顺着别的网站上面留下的外链爬过来的。下面我们演示怎样将通过光年SEO日志分析软件生成的日志报告中显示的404状态不存在的页面都屏蔽掉,不让蜘蛛抓取。

  首先登陆百度站长平台,点击左边菜单的“Robots工具”进入Robots自动生成界面。然后将上图中404状态的页面路径整理后复制到Robots工具输入框中。

  

  User-agent底下选择“所有”,状态选择“不允许抓取”,输入路径后点击后面的“创建”,上图我们测试了两个路径,分别是目录和一个文件,可以一下子输入多个路径,建议先在记事本里面将网址整理好再提交,一行一个路径。

  

  点击“创建”以后,可以看到,底下的robots.txt内容中出现的代码,而且百度站长平台Robots工具有一个好处就是,不论你是多层目录还是网站单文件页面,它都自动识别后排序生成,不会造成单页面和目录顺序错乱造成蜘蛛抓取robots.txt的时候出现错误,所以我们大不必担心格式问题了。

  

  将所有需要屏蔽的页面或路径都生成以后,点击底下的“下载”,然后将robots.txt上传到网站根目录就可以了。

  小提示:robots.txt上传以后,我们可以通过robots检测工具来实验一下robots.txt是否有效或者有什么错误,CHINAZ、SEOWHY、爱站等网站都有相关工具的。

  建议用一个记事本收集404状态页面,然后整理存档,每次发现IIS日志中有新的404页面出现,就在以前的存档里面查找一下是否有重复,没有重复就可以直接添加到robots.txt文件中了。

  本文由利川在线http://www.445400.com原创,转载请注明出处。

时间: 2024-10-28 10:46:40

Robots.txt的写法和利用百度站长平台工具自动生成的相关文章

巧妙利用百度站长平台死链工具删除被百度收录的挂马网址

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 前一段时间,由于程序漏洞造成网页内容多处被挂博彩的内容信息,木马删除后,但是百度收录的挂马页面却都过去几个月了依然还是存在于是利用百度站长平台工具的死链提交将挂马页面删除.下面就为大家分享一下详细的操作方法: 一.网站配置 我的网站挂马网页的网址全部为:http://www.sjbj.cc/index.php?id=90799290418此种

2012年新趋势:利用百度站长平台提升seo效果

2011年底,百度推出了站长平台,可以帮助站长更好的掌握网站收录情况,统计数据等.对我们这些优化人员来说,百度推出的任何一项产品都不能忽视,而百度站长平台无疑在与第三方网站的关系上进步不少,提供了不少帮助,下面小编来分享一下使用百度站长平台的一点感想. 百度站长平台的介绍 首先,百度官方给的介绍是:百度站长平台是一个服务于百度网页收录的数据提交平台.可以: 1. 向百度推送您网站希望被百度收录的数据;2. 在一定程度上减轻抓取产生的额外负担;3. 网页更容易被百度发现和抓取,新增及删除的数据能更

百度站长平台LEE:“石榴”与“起源”算法问题解答

站长网(admin5.com)消息:5月20日"2013百度站长平台高端SEO俱乐部"活动在北京举行.活动就近期推出的"石榴"与"起源"原创算法.原创项目等问题与站长和SEOer进行了交流.百度站长平台SEO专家LEE就站长们普遍反映的问题一一进行了解答. Lee在沙龙活动中分享的主要内容: 站长平台新工具:百度站长平台近期将推出网站异常提醒功能,及时告知网站负责人网站的异常信息,例如网站出现大量死链.网站遭遇黑客攻击.错误屏蔽百度蜘蛛服务器以及

百度站长平台与百度统计实现账号互通

中介交易 SEO诊断淘宝客 站长团购 云主机 技术大厅 各位网站管理员, 很高兴的通知大家,百度站长平台与百度统计在今日实现账号互通,只要拥有任意一个平台的账号,就可以同时使用这两个平台,并可便捷的将统计账号下的站点同步至站长平台,减少重复注册及验证网站带来的烦恼. 账号互通效果展示: 1.百度统计用户登录百度站长平台 第一步:在百度站长平台(http://zhanzhang.baidu.com/)登录页面选择使用"联盟账号"进行登录: 第二步:同步站点 首次登录后,会有页面提示是否同

说到掉渣的ROBOTS.TXT的写法

摘要: 记得很早以前,那个时间新浪屏蔽百度蜘蛛的事件传得很大,其实你主要是学会了ROBOTS.TXT的写法,那就简单的了,两下就认出了这事的真假.所以说学好技术,可以更好的知道真相. 记得很早以前,那个时间新浪屏蔽百度蜘蛛的事件传得很大,其实你主要是学会了ROBOTS.TXT的写法,那就简单的了,两下就认出了这事的真假.所以说学好技术,可以更好的知道真相. 首先,我们先来认识我们亲爱的蜘蛛们吧: 国内的搜索引擎蜘蛛 百度蜘蛛:baiduspider 搜狗蜘蛛:sogou spider 有道蜘蛛:

百度站长平台robots工具已上线

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 百度站长平台robots工具全新上线,新上线的robots工具面向全部网站开放.网站管理员可登录百度站长平台:http://zhanzhang.baidu.com/直接使用,帮助网站管理员了解网站的robots设置情况是否正常,避免错误地封禁搜索引擎.站长可根据自己的需求设置好封禁规则,生成新的robots文件,上传到网站根目录下.还可以及时

浅谈:如何利用百度站长工具促进网站排名

SEO从业者有福了!如今我们做SEO,有百度站长平台进行指导,我们从中可以获取大量的百度搜索引擎的算法原理,我们可以基于这个原理使我们的网站更加符合百度的准则,从而获取更好的排名,这在几年前是我们从未曾想到的.记得刚开始做SEO的时候,基本都是靠道听途说,听说每天更新文章能促进排名,就每天绞尽脑汁地去更新,听同行说SEO就是发外链,我们就天天不停地去发外链,但我们始终没有一个依据.就像我们现代的高考,有了教育部门会有一个考试大纲,我们可以按照大纲上的内容针对性的进行复习,而不是像无头的苍蝇一样到

百度确认支持Nofollow属性 内测百度站长平台

Nofollow标签是由Google领头新创的一个标签,目的是尽量减少垃圾链接对搜索引擎教程的影响,减少博客的垃圾留言,目前Google.Yahoo.微软都表示支持这一标签.当超级链接中出现nofollow标签后,搜索引擎会不考虑这些链接的权重,也不用使用这些链接用于排名. 在ZAC的日志中,除了技术细节更多是关于百度对站长更开放的讨论,例如百度设立了官方的交流贴吧和站长互动,甚至还在内测一款类似"Google网站管理员工具"的名为"百度站长平台"的工具. 在贴吧里

百度站长平台测试通用工具图文详解

中介交易 SEO诊断 淘宝客 云主机 技术大厅 百度站长平台测试版已经上线.鉴于我们这些站长每时每刻都在于百度打交道的情况,门老师就先行试用了一下百度站长平台测试版本的各项功能. 打开百度站长平台网页,第一步就是添加网站的对话框.我们在里面输入网址,然后就是验证网站的归属.验证方式有两种,一个是文件验证,另一种是添加html标签.很简单.下面是站长平台各项工具介绍. 百度站长平台的站长工具,有死链工具.Sitemap.站点索引量查询和抓取压力反馈工具.其中死链工具基本上其他站长工具都有,站点索引