如果你真的想屏蔽百度蜘蛛 尝试以下方法

  好像现在屏蔽baiduspider已经成为一种时尚,难道这玩意也跟着纳斯达克变?

  首先我自己不会屏蔽baiduspider,也不大相信baiduspider会故意忽略robots.txt,但如果你真的想屏蔽 baiduspider,可尝试以下方法:

  1. 上传一个robots.txt到根目录,内容为:

  User-agent: baiduspider

  Disallow: /

  一个搜索引擎爬虫工作前首先应该访问/robots.txt制定排除列表,baiduspider还无法高级到故意忽略某些网站的robots.txt,不知道baiduspider怎么折腾才能让robots.txt失效。

  2. 如果仅仅因为服务器吃不消,不防按照的指示写信给百度。估计很多人试过得不到回复(Google基本都是2个工作日内回复)。

  3. 如果还没有办法,可尝试.htaccess屏蔽,上传一个.htaccess文件到根目录,内容为:

  SetEnvIfNoCase User-Agent "^baiduspider" ban_bot

  deny from env=ban_bot

  还可以扩大这个列表,屏蔽那些Email提取爬虫、网站克隆爬虫等(小偷一般不守法,但总比自己什么都不做强):

  SetEnvIfNoCase User-Agent "^baiduspider" ban_bot

  SetEnvIfNoCase User-Agent "^HTTrack" ban_bot

  SetEnvIfNoCase User-Agent "^EmailCollector" ban_bot

  SetEnvIfNoCase User-Agent "^EmailWolf" ban_bot

  SetEnvIfNoCase User-Agent "^ExtractorPro" ban_bot

  SetEnvIfNoCase User-Agent "^Offline" ban_bot

  SetEnvIfNoCase User-Agent "^WebCopier" ban_bot

  SetEnvIfNoCase User-Agent "^Webdupe" ban_bot

  SetEnvIfNoCase User-Agent "^WebZIP" ban_bot

  SetEnvIfNoCase User-Agent "^Web Downloader" ban_bot

  SetEnvIfNoCase User-Agent "^WebAuto" ban_bot

  SetEnvIfNoCase User-Agent "^WebCapture" ban_bot

  SetEnvIfNoCase User-Agent "^WebMirror" ban_bot

  SetEnvIfNoCase User-Agent "^WebStripper" ban_bot

  deny from env=ban_bot

  .htaccess要用文本方式上传,有些Apache配置比较怪异,防止引起冲突建议上传后立刻看看是否影响普通用户的访问。如果浏览正常,再用FlashGet模拟baiduspider测试这个.htaccess是否工作,方法是:

  FlashGet->工具->选项->协议,把HTTP用户代理改成用户自定义:baiduspider;然后用FlashGet下载该网站任意页面,在FlashGet的下载日志里得到HTTP/1.1 403 Forbidden则成功.

  本文章转自[中国建站论坛] http://www.jianz.cn 为中国站长提供动力。

  站长网新闻榜 www.admin5.com/top

时间: 2024-09-20 00:13:40

如果你真的想屏蔽百度蜘蛛 尝试以下方法的相关文章

腾讯微博正式全面屏蔽百度蜘蛛

现在,电视上和网络上都在热议一个人:邬敬民.前几天还在百度搜索他的名字,出现第一名的是邬敬民的腾讯微博.但是今天早上想再找点关于他的资料的时候,在百度搜索邬敬民.邬敬民腾讯微博等关键词都没有找到他的微博,于是我看了一下腾讯微博的robots,大家也可以去看看,打开http://t.qq.com/robots.txt,看到显示的内容如下图:   这说明,腾讯微博已经正式全面屏蔽百度蜘蛛,但也仅是百度蜘蛛,对谷歌以及除百度外的其他搜索引擎,这就让人深思了. 我在今年2月份的时候在A5发表过一篇<微博

淘宝网屏蔽百度蜘蛛 洪波称其为“自残”行为

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 9月6日消息,据博客消息,淘宝网已经开始屏蔽百度蜘蛛(BaiduSpider),用户将很难通过百度搜索到淘宝网的商家及商品信息,但对Google等其他搜索引擎并未采取相同的屏蔽措施. 记者访问www.taobao.com/robots.txt发现,淘宝网站根目录下的robots.txt文件中已经设置拦截百度蜘蛛"Disallow:/

分析马云为何要屏蔽百度蜘蛛

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 连日来,"淘宝封掉百度"成为了IT圈里传播最广的新闻. 据消息,淘宝网已经开始屏蔽百度蜘蛛(BaiduSpIDEr),用户在百度搜索中将很难搜索到淘宝网商家及商品信息.不过,Google等其他搜索未在屏蔽之列. 看法: 一. 淘宝全部封掉百度是不可能的,现在不可能,将来也不可能,除非其中一家倒闭.互联网发展到现在,任何试图

淘宝屏蔽百度蜘蛛 C2C正面交锋开始

对于淘宝屏蔽百度蜘蛛,淘宝网http://www.aliyun.com/zixun/aggregation/34647.html">公关总监卢维兴表示,淘宝上有一些用户的隐私数据是肯定不允许搜索引擎抓取的.对淘宝是否完全屏蔽了百度的索引,卢维兴表示对此还不清楚. 今天实际上已经是完全屏蔽了http://www.taobao.com/robots.txt   可以看出 User-agent: Baiduspider       Disallow: /       User-agent: ba

淘宝、搜狐博客均屏蔽百度蜘蛛爬虫

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 据百度内部人士透露,百度电商平台将再次推迟上线,原因是淘宝屏蔽百度. "没法想像,在百度电子商务频道搜索某商品,得到的结果仅仅有十几家网店."百度内部人员称:"淘宝的屏蔽给李明远带来大麻烦." 被淘宝屏蔽,百度电子商务搜索将面临无米之炊.如果连搜索结果都不能保障,百度的竞价排名收入也无从谈起. 上周有媒

淘宝、搜狐博客屏蔽百度蜘蛛爬虫

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 据百度内部人士透露,百度电商平台将再次推迟上线,原因是淘宝屏蔽百度. "没法想像,在百度电子商务频道搜索某商品,得到的结果仅仅有十几家网店."百度内部人员称:"淘宝的屏蔽给李明远带来大麻烦." 被淘宝屏蔽,百度电子商务搜索将面临无米之炊.如果连搜索结果都不能保障,百度的竞价排名收入也无从谈起. 上周有媒

想让百度收录的另类方法

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 按照大家的说法,一般每天坚持更新网站,百度会很快收录的. 其实这是一个大大的误区.本人网站是qq163电影网.以前三个月,基本每天更新网站,可是几个月以来,百度一直都不收录qq163电影网.有些泄气了qq163电影网停止更新了20多天,结果百度收录了.我 211.html">觉得不是偶然了,因为以前做过一些站 ,传上空间后不闻

解秘:让百度蜘蛛常驻网站的四个方法

大家好,我是胖子.百度蜘蛛是公认最活跃的搜索引擎程序,一般我们通过IIS日志看到蜘蛛记录的时候非常的开心,特别是收录我们的内容和更新快照的时候,在这里从新站和老站谈让百度蜘蛛常驻的方法. 1.内容吸引蜘蛛来,个人建议是:新站前期靠坚持,老站靠稳定. 当网站框架已定,站内要做的就是内容,坚持更新内容才是永远的王者.内容首先是吸引用户和蜘蛛抓取是非常重要的组成部分,蜘蛛对内容刚开始就好比人喝刚开始咖啡的时候,先苦后浓浓的香味. 但很多朋友都比较懒,习惯性的每天去采集,有的更加懒直接用工具生成内容,这

淘宝为什么要屏蔽百度搜索呢?

摘要: 如果你经常在网上购物的话,当你通过百度搜索某一件商品,你有没有发现,从来没有出现过来自淘宝网的商品结果,如果你还没有注意到这个现象,你现在就可以搜索下试试,比如搜 如果你经常在网上购物的话,当你通过百度搜索某一件商品,你有没有发现,从来没有出现过来自淘宝网的商品结果,如果你还没有注意到这个现象,你现在就可以搜索下试试,比如搜索"iphone手机"."平板电脑"等等.这就是因为百度搜索蜘蛛被淘宝网屏蔽了抓取,从而导致百度不能索引淘宝网数据,其实这已经不能够算是