世界各大搜索引擎的蜘蛛名称列表-搜索引擎技术

本文记录了全世界比较出名的Robots.txt 列表需要设置的搜索蜘蛛。如何设置那个目录不想被搜索引擎收录的可参照下去设置。
 
当然也必须从Robots.txt 去设置

下列为比较出名的搜索引擎蜘蛛名称:
Google的蜘蛛: Googlebot
百度的蜘蛛:baiduspider
Yahoo的蜘蛛:Yahoo Slurp
MSN的蜘蛛:Msnbot

Altavista的蜘蛛:Scooter
Lycos的蜘蛛: Lycos_Spider_(T-Rex)
Alltheweb的蜘蛛: FAST-WebCrawler/
INKTOMI的蜘蛛: Slurp

如需要参考的可以参照本文:
User-agent(用户代理设置):(蜘蛛名字)
拒绝:(文件名字)

User-agent: Black Hole
Disallow: /
User-agent: Titan
Disallow: /
User-agent: WebStripper
Disallow: /

User-agent: NetMechanic
Disallow: /
User-agent: CherryPicker
Disallow: /
User-agent: EmailCollector
Disallow: /

User-agent: EmailSiphon
Disallow: /

User-agent: WebBandit
Disallow: /

User-agent: EmailWolf
Disallow: /

User-agent: ExtractorPro
Disallow: /
User-agent: CopyRightCheck
Disallow: /

User-agent: Crescent
Disallow: /
User-agent: NICErsPRO
Disallow: /

User-agent: Wget
Disallow: /
User-agent: SiteSnagger
Disallow: /

User-agent: ProWebWalker
Disallow: /
User-agent: CheeseBot
Disallow: /
User-agent: mozilla/4
Disallow: /
User-agent: mozilla/5
Disallow: /

User-agent: Mozilla/4.0 (compatible; MSIE 4.0; Windows NT)

时间: 2025-01-26 23:02:21

世界各大搜索引擎的蜘蛛名称列表-搜索引擎技术的相关文章

世界各大搜索引擎的蜘蛛名称列表

中介交易 SEO诊断 淘宝客 云主机 技术大厅 本文记录了全世界比较出名的Robots.txt 列表需要设置的搜索蜘蛛.如何设置那个目录不想被搜索引擎收录的可参照下去设置. 当然也必须从Robots.txt 去设置 下列为比较出名的搜索引擎蜘蛛名称: Google的蜘蛛: Googlebot百度的蜘蛛:baiduspiderYahoo的蜘蛛:Yahoo SlurpMSN的蜘蛛:MsnbotAltavista的蜘蛛:ScooterLycos的蜘蛛: Lycos_Spider_(T-Rex) All

最新各大搜索引擎蜘蛛名称整理分享

各大seo 搜索引擎的蜘蛛会不断地访问抓取我们站点的内容,也会消耗一定的站点流量,有时候就需要屏蔽某些蜘蛛访问我们的站点.其实常用的搜索引擎就那么几个,只要在robots文件里把常用的几个搜索引擎蜘蛛放行就好,其它的统统通过通配符(*)禁止掉.阿修百度了一下搜索引擎蜘蛛名称,但得到的结果让阿修很是抑郁,几乎都是原文复制粘贴的文章,而且很多的资料都是过时的了,哪怕是最近发表的文章也是抄袭的旧资料根本就没修正和更新,并且关于蜘蛛名称.大小写众说不一,根本就找不到一个准确的资料.所以阿修决定根据自己空

世界第二大搜索引擎百度已经引起全球营销商的注意

中介交易 SEO诊断 淘宝客 云主机 技术大厅 国际IT评估机构 comScore 近日宣布,百度已成为全球第二大搜索引擎,引起了全球搜索引擎市场的大幅洗牌和剧烈变化,并且百度最近已经引起全球营销商的注意. ComScore的进一步报告说,百度目前在中国平均每个月有超过800亿的搜索次数,这个庞大的数字意义着百度在中国市场的占有率接近76%,谷歌中国目前的统计结果是19.8个百分点. 得到这份最新报告后, 我们 earchengineland 团队宣布,已经改变了对于百度与中国的关系,因为我们已

武汉SEO:浅析搜索引擎的蜘蛛的工作方式

武汉seo今天想聊聊搜索引擎的蜘蛛的工作方式.先说说搜索引擎的原理吧.搜索引擎是把互联网上的网页内容存在自己的服务器上,当用户搜索某个词的时候,搜索引擎就会在自己的服务器上找相关的内容,这样就是说,只有保存在搜索引擎服务器上的网页才会被搜索到.哪些网页才能被保存到搜索引擎的服务器上呢?只有搜索引擎的网页抓取程序抓到的网页才会保存到搜索引擎的服务器上,这个网页抓取程序就是搜索引擎的蜘蛛.整个过程分为爬行和抓取. 一. 蜘蛛 搜索引擎用来爬行和访问网站页面的程序被称为蜘蛛,也可称之为机器人.蜘蛛访问

2016年亚太将取代北美成为世界第一大数字广告区域市场

研究和咨询机构Strategy Analytics最新的广告预测显示,2016年,亚太将取代北美首次成为数字广告支出最大市场. 亚太数字广告支出2016年将增长18.2%达到597亿美元,而北美将增长9.6%达到595亿美元.亚太蹿升至首位是由中国市场驱动的,中国作为紧随美国(556亿美元)的世界第二大数字广告支出国家,2016的数字广告支出将增长25.1%至224亿美元.2016年,中美两国将合占全球数字广告支出的44%. 除了中国,亚太区挤入全球前六的国家还有日本(第四名),韩国(第六名),

PHP禁止掉某地区的IP访问网站,不过滤搜索引擎的蜘蛛

这个里面的代码直接拷贝了OSC一位朋友的,稍等下来贴地址.这会儿太慢,找不到了..   function get_ip_data(){ $ip=file_get_contents("http://ip.taobao.com/service/getIpInfo.php?ip=".get_client_ip()); $ip = json_decode($ip); if($ip->code){ return false; } $data = (array) $ip->data;

让搜索引擎的蜘蛛更好的抓取我们的网站

搜索引擎的蜘蛛是靠爬行来抓取互联网上的信息,也就是说要想被百度或是谷歌等搜索引擎收录,一般情况下是要有链接存在,让搜索引擎的蜘蛛程序顺着链接爬到网站里,蜘蛛来过了,才能有效的抓取.给了让搜索引擎更好的抓取网站内容,我们通常要做的事情是: 第一,先准备好要被抓取的网页("食物") 站长通常都会说"喂饱蜘蛛",指的就是更新网站的内容,让小蜘蛛来了之后有"东西吃",可以抓取到网页信息,而不是让它空手而归.搜索引擎的蜘蛛喜欢原创内容,所以我们为了提高网站

没有它世界都会停止运作——世界第一大机器人制造商“发那科”成长通史

在许多人眼中,工业机器人也许还是一个距离很远的概念,但其实它们早已无孔不入了的渗透了现代生活.大到街上奔驰的汽车,小到我们手持的苹果手机背板,都可能是出自工业机器人之手.其中,占据全球工业机器人五成销售额的就是我们今天的主角,日本企业FANUC(发那科").有分析师曾经明言,若是没有了这家"发那科",全球都会停止运作. 日前彭博社发表了关于Fanuc的长文,娓娓道来讲述了这家伟大的企业从无到有.屡经挫折而激流勇进的故事.雷锋网在此为您做如下编译. Fanuc(发那科)的总部坐

世界十大著名黑客 居然还有苹果创始人!

世界十大黑客指的是世界上比较顶尖的电脑高手,包括李纳斯,沃兹尼克,肯汤普生等.黑客一词来源于英文hacker,原指热心于计算机技术,水平高超的电脑专家,尤其是程序设计人员,早期在美国的电脑界是带有褒义的.但在媒体报导中,黑客一词往往指那些"软件骇客" 10[约翰·德拉浦]他发现了使用"嘎吱嘎吱船长"牌的麦片盒作为奖品的哨子可免费打长途电话.嘎吱嘎吱船长牌的麦片盒里吹口哨,能产生2600赫兹音调,这是让电话系统开启一个电话呼出的蓝匣子,用户就也可以免费地打长途电话.少