常见搜索引擎蜘蛛大全

  百度 baidu.com----Baiduspider

  http://www.baidu.com/search/spider.htm

  谷歌 google.com----Googlebot

  http://www.google.com/bot.html 中文版请打开以下页面

  http://www.google.cn/support/webmasters/bin/topic.py?topic=8843

  雅虎yahoo.com----Yahoo

  http://misc.yahoo.com.cn/help.html 打开后跳转到以下页面

  http://help.cn.yahoo.com/property.html?product=websearch

  有道 yodao.com----YodaoBot

  http://www.yodao.com/help/webmaster/spider/

  搜搜 soso.com----Sosospider/Sosoimagespider(网页蜘蛛/图片蜘蛛)

  http://help.soso.com/webspider.htm

  http://help.soso.com/soso-image-spider.htm

  搜狗 sogou.com----sogou

  http://www.sogou.com/docs/help/webmasters.htm#07

  微软 msn.com----msnbot

  http://search.msn.com/msnbot.htm 打开后跳转到以下页面

  http://help.live.com/help.aspx?mkt=zh-cn&project=wl_webmasters

  以下是几只收获(抓取页面)不劳动(不来流量)的蜘蛛 可以考虑禁了它们爬行 省空间流量

  国外搜索引擎

  gigablast.com----Gigabot

  http://www.gigablast.com/spider.html

  国外搜索引擎

  webalta.net----WebAlta

  http://www.webalta.net/ru/about_webmaster.html

  国内的一个实验室的

  apex.sjtu.edu.cn

时间: 2024-09-22 04:43:32

常见搜索引擎蜘蛛大全的相关文章

搜索引擎蜘蛛IP地址大全

各类搜索引擎蜘蛛IP地址大全 百度蜘蛛           220.181.38.177     220.181.19.*     159.226.50.*     202.108.11.*     202.108.22.*     202.108.23.*     202.108.249.*     202.108.250.*     61.135.145.*     61.135.146.* google蜘蛛    216.239.33.*    216.239.35.*      216.

最新各大搜索引擎蜘蛛名称整理分享

各大seo 搜索引擎的蜘蛛会不断地访问抓取我们站点的内容,也会消耗一定的站点流量,有时候就需要屏蔽某些蜘蛛访问我们的站点.其实常用的搜索引擎就那么几个,只要在robots文件里把常用的几个搜索引擎蜘蛛放行就好,其它的统统通过通配符(*)禁止掉.阿修百度了一下搜索引擎蜘蛛名称,但得到的结果让阿修很是抑郁,几乎都是原文复制粘贴的文章,而且很多的资料都是过时的了,哪怕是最近发表的文章也是抄袭的旧资料根本就没修正和更新,并且关于蜘蛛名称.大小写众说不一,根本就找不到一个准确的资料.所以阿修决定根据自己空

iis 搜索引擎蜘蛛

一.IIS中网站的日志的设置. 打开IIS.选择所要设置的网站属性.弹出如下窗口:   "启用日志记录",勾选,选择"W3C扩展日志文件格式". 再次点击这里的"属性"按钮,常规选项里面,选择新日志计划为"每天",当然也可以选择其他,选择好保存日志文件的目录.   按照一般情况,设置到这里就可以记录日志了,但是有些主机无论如何都找不到搜索引擎爬虫的痕迹,类似于Baiduspider+怎么都看不到.这个时候我们就需要启用剩下的三

深入剖析搜索引擎蜘蛛工作对SEO的提升

搜索引擎蜘蛛是搜索引擎自身的一个程序,它的作用是对网站的网页进行访问,抓取网页的文字.图片等信息,建立一个数据库,反馈给搜索引擎,当用户搜索的时候,搜索引擎就会把收集到的信息过滤,通过复杂的排序算法将它认为对用户最有用的信息呈现出来.深入分析网站的SEO表现的时候,一般我们就会考虑搜索引擎蜘蛛的抓取质量,而其中能够帮我们优化网站可能会涉及到下面的几个蜘蛛抓取相关的概念: 1.爬取率:既定时间内网站被蜘蛛获取的页面数量. 2.爬取频率:搜索引擎多久对网站或单个网页发起一次新的爬行. 3.爬取深度:

谈从iis日志中探寻搜索引擎蜘蛛活动痕迹

在站点的优化过程中个并不是说所有的站点问题都可以直接从站长工具上得到信息,往往站长工具上得到的信息都是在站点出现问题后才能察觉到.作为一名SEOer,我们更需要学会站点的隐性信息.例如,这几天做的外链效果怎样?我们的内容那些方面更加容易受到搜索引擎蜘蛛的喜爱?搜索引擎蜘蛛对于我们站点的爬行积极度如何?等等,这些都是隐藏在站点内容部的一些关键信息.这些信息通过站长工具我们很难分析.而这些信息恰恰可以从我们的站点IIS日志上找到答案. 一:为何IIS日志在分析站点隐性信息中如此重要 1:借由该日记记

让网站用稳定赢得搜索引擎蜘蛛的信任

网站在建设和维护中,会遇到很多的问题,其中很重要的就是稳定性.所以在这里金智慧就个人对此的经验和观点和大家分享下: 第一:确保网站定位一定明确. 这里直接关系到网站源程序的稳定.因为网站做不同的内容和发展方向的不同将决定源程序的框架结构.如果我们的定位变了,比如本来想做内容的后来改做论坛,那网站源程序换不换就由不得你了.孙悟空七十二变是人才,网站七十二变就是庸才了.一天一个样,蜘蛛可没那本事火眼精精.而个人站长定位网站前建议从自己擅长的开始. 第二:确保网站的头文件的稳定 对于网站title,d

搜索引擎蜘蛛原理深入剖析

  经常与站长打交道,定期组织A5杂谈站长录活动,对于搜索引擎蜘蛛工作原理也有一定了解,再此总结个人的一些心得,没有涉及到任何的技术,重在思维.认真读的朋友,一定会有收获. 搜索引擎好比总司令,蜘蛛就是他的手下.蜘蛛也分等级,我们就简单分成3个等级,初级蜘蛛(普通士兵),中级蜘蛛(普通军官),高级蜘蛛(高级军官). 我们一直认为蜘蛛很神秘,其实很简单,其原理是.它就相当一个我们有经常用到的采集器,能抓取到你网站的页面,将你网站页面的内容放入自己的数据库,将采集到的结果与数据库原有的信息一一进行匹

从五个方面下手 让搜索引擎蜘蛛恋上你的站点

假如搜索引擎无法很好的游览到我们站点的内容,那么我们即使在站点投入多大的精力也都是竹篮打水一场空.为了避免该事情发生最好的解决之道就是我们能够很完整的去规划好我们整个站点的结构. 首先,我们在开始构建我们站点之前,我们都是需要先去好好的分析搜索引擎爬行的模式与规律,因为我们都知清楚搜索引擎是借助"蜘蛛"爬行我们站点源代码进行抓取链接,从而很好搜集我们的站点页面,从而入库到搜索引擎数据库,这就是搜索引擎简要的收录过程,同时搜索引擎会根据一定的算法,如页面的速度.社会信号等等进行权重的分配

搜索引擎蜘蛛为什么会不访问你的网站

许多站长都有查看网站日志的习惯,这么做的主要目的就是为了分析蜘蛛爬行网站的情况,当然其中多数站长也只是简单的了解一下当天蜘蛛爬行的次数,这一点就足够发现问题了.有时候,我们会觉得自己的网站已经相当完美了,而正常优化过程中,蜘蛛却对此不感冒,让人很是着急.   了解原理就很容易理解,搜索引擎借助蜘蛛在互联网这张大网中搜寻"猎物",它唯一所能依据的线索就是链接了,找到新的链接后,根据复杂的算法最终对网站进行排名,储存在数据库中.很多网站可能会因为网站结构混乱失去蜘蛛到访的机会,然而蜘蛛不访