蜘蛛不访问网站的原因 你是否清楚?

  相信很多站长同小编一样,每天都有查看网站日志的习惯,然后通过日志的分析来了解蜘蛛在我们网站爬行抓取的状况,当然在这个过程中小编通常只是简单的看一下蜘蛛每天爬行我网站的次数,从这点就能够直观的看出网站的健康状况,但是在对于很多站长而言,他们的网站自我感觉非常的完美,但是蜘蛛确不爬行抓取,这无疑对站长们有很大的打击,所以今天小编特地整理了一些蜘蛛不访问我们网站的几点原因,下面来分享给大家。

  (一)网站flash、图片过多。

  不得不说,各大搜索引擎发展到现在,已经算是相当的智能化了,特别是近些年来各大搜索引擎不断更新算法,就例如说在2011年的时候谷歌推出的图片搜索功能,我们能够从这些图片中找到源网页的地址,但是毕竟是搜索引擎,他还是有着不小的差距。然而在这时候很多站长,特别是企业站,为了突出产品,在网站中镶入大量的flash、图片,但是大家都知道搜索引擎蜘蛛是无法抓取flash、和图片文件的,所以即便是我们的内容在好,也都是无法让蜘蛛抓取爬行的。所以对于那些网站中存在大量图片以及flash的网站,小编建议各位用一些模拟蜘蛛爬行的工具检测一下自己的网站,看看是否是因为此情况造成蜘蛛不访问我们的网站。

  (二)网站存在大量的死链接。

  我们幻想一下,每当蜘蛛开开心心的访问我们的网站的时候,通过源码爬行我们网站各个链接的时候,本以为能够找到一些新鲜的好内容,然而却是一大堆的死链接等待着它,就这样一次、两次、三次,每次来都有这样的情况出现,那么你认为蜘蛛会对你的网站有一个好的评价,还会再次的抓取你网站的内容吗?就像我网站www.qqya.cc当时就是因为大量的404页面被蜘蛛抓取,造成那一段网站内容不被搜索引擎收录,所以后来小编在观察网站日志中发现蜘蛛爬行的页面中含有有状态码为404的页面才恍然大悟,所以也立即的对这些404页面进行清除、屏蔽,并且在那段时间发了不少的外链,后来网站蜘蛛爬行抓取也都正常了。

  (三)网站外链与nofollow标签。

  蜘蛛能够经常的访问我们网站的原因,相信很大一部分都是外链吸引的,所以对于外链的友好程度,我们也是需要经常观察的,以免做了徒劳。相信很多站长这时候应该会问了,为什么这样讲,怎么判断外链的友好程度呢?在这里小编是这样做的,每天检查蜘蛛访问我们网站的次数之外,还要检查蜘蛛的入口,通过这些入口来判断我们做的外链是否是有价值的,这样每天进行一个总结,把有效的外链记录下来,那么时间一久就打造了我们自己的外链资源库咯,当然从这些数据中我们也可以判断出那些是无用的外链,就例如说带有nofollow标签的外链(如百度经验)对于这种的话我们就以后不要在做,因为做了也是徒劳哈。

  (四)网站中存在复杂的代码以结构。

  大家都知道,蜘蛛是通过网站的源文件代码来进行访问我们的网站,所以这时候我们就需要优化我们的网站代码,因为冗长的代码对网站无任何意义,并且还会影响到我们网站的打开速度,并且还会让蜘蛛反感。另外就是对于那些结构也是不利于蜘蛛爬行的抓取的,因为通常蜘蛛是首先访问我们的网站首页,然后到抓取栏目,在抓取内容这样的活动规律,然而这样的活动次数通常也都是被蜘蛛限定在3次以内,所以过于复杂,而且权重又不高的网站,是很不利于蜘蛛抓取的哦。

  (五)错误的网站地图。

  网站地图是让蜘蛛快速了解我们网站整个结构的一个页面,那么一个好的网站地图,会为蜘蛛爬行带来一个快捷的入口。当然如果是一个存在大量死链的错误地图的话,无疑也会毁了整个网站的爬行状态,所以我们在做网站的地图的时候一定要谨慎行事。

  总结:其实蜘蛛不访问我们网站原因除了小编上面提到的之外,还有很多别的原因,例如说违法的内容、大量采集来的内容、黄色恶意信息等等都是有可能造成我们网站不被搜索引擎蜘蛛抓取的,所以具体的细节性问题,我们还要根据自己的网站日志来自行进行判断。今天就写到这里,本文由http://www.name2012.com/游戏名字网站长原创分享,转载请带上链接,谢谢。

时间: 2024-12-30 20:55:03

蜘蛛不访问网站的原因 你是否清楚?的相关文章

搜索引擎蜘蛛不访问网站的因素

摘要: 许多站长都有查看网站日志的习惯,这么做的主要目的就是为了分析蜘蛛爬行网站的情况,当然其中多数站长也只是简单的了解一下当天蜘蛛爬行的次数,这一 点就足够发现问题了.有 许多站长都有查看网站日志的习惯,这么做的主要目的就是为了分析蜘蛛爬行网站的情况,当然其中多数站长也只是简单的了解一下当天蜘蛛爬行的次数,这一 点就足够发现问题了.有时候,我们会觉得自己的网站已经相当完美了,而正常优化过程中,蜘蛛却对此不感冒,让人很是着急. 了解原理就很容易理解,搜索引擎借助蜘蛛在互联网这张大网中搜寻"猎物&

浅谈如何解决百度蜘蛛不访问网站

百度今天凌晨更新了,祁多多博客关键词排名和收录没有什么变化,电商圈还持续一段时间在百度2,3页各占一个位置,外链倒是一下子放出了1000 多.唯一郁闷的还是百度的快照没有更新,site一下首页也没有降权,真是太无奈了,索性去查了下网站日志,看看是百度蜘蛛不来访呢还是来访了不抓取呢,一看吓了一跳,这几天百度蜘蛛压根就没有来访过.祁多多就结合自己这几天操作浅谈一下蜘蛛不来访问的原因. 1.网站空间不稳定的影响 网站空间不稳定的影响应该是首当其中的原因,持续3天,每天都定时关,并且在蜘蛛最活跃的时间让

六省网络前日瘫痪无法访问网站

5月19日21:50开始到24时,我国江苏.安徽.广西.海南.甘肃.浙江六省出现网络故障,很多互联网用户发现访问互联网速度变慢或者干脆无法访问网站.原因昨天找到,主要是由于暴风影音网站自身域名解析出现问题导致网络故障. 昨天下午,工信部通信保障局召集国家计算机应急处理协调中心.电信研究院.中国电信集团.暴风影音公司等召开了紧急会议.据称,经查明,事故原因是DNS域名解析故障.DNS域名解析是网络用户访问互联网时服务商所进行的必要工作,普通用户在访问互联网时一般是输入网站的域名,但在后台技术上则需

PHP禁止掉某地区的IP访问网站,不过滤搜索引擎的蜘蛛

这个里面的代码直接拷贝了OSC一位朋友的,稍等下来贴地址.这会儿太慢,找不到了..   function get_ip_data(){ $ip=file_get_contents("http://ip.taobao.com/service/getIpInfo.php?ip=".get_client_ip()); $ip = json_decode($ip); if($ip->code){ return false; } $data = (array) $ip->data;

通过PHP程序统计蜘蛛是否访问你的网站

程序|访问|统计|蜘蛛 搜索引擎的蜘蛛访问网站是通过远程抓取页面来进行的,我们不能使用JS代码来取得蜘蛛的Agent信息,但是我们可以通过image标签,这样我们就可以得到蜘蛛的agent资料了,通过对agent资料的分析,就可以确定蜘蛛的种类.性别等因素,我们在通过数据库或者文本来记录就可以进行统计了. 数据库结构: ## 表的结构 `naps_stats_bot`# CREATE TABLE `naps_stats_bot` (  `botid` int(10) unsigned NOT N

海蜘蛛外网访问网站出现 Check flash 错误

问题描述 海蜘蛛版本:海蜘蛛路由V8final免费版Build1231在内网的一台机器上安装了IIS,跑的ASP程序在海蜘蛛上做了端口映射80这几天发现在外网(不同外网环境下)访问这个网站会提示HTTP/1.1404NOTFOUND!Checkflash:/wnm2.2.2-0005.zip然后我至少刷新页面3次,才能正常访问网站.然后过上好久,继续出这个问题然后如此循环请教高人如何解决这个问题. 解决方案 本帖最后由 mrgky 于 2011-05-10 11:26:17 编辑解决方案二:该回

通过PHP程序知道蜘蛛是否访问你的网站(附代码)

搜索引擎的蜘蛛访问网站是通过远程抓取页面来进行的,我们不能使用JS代码来取得蜘蛛的Agent信息,但是我们可以通过image标签,这样我们就可以得到蜘蛛的agent资料了,通过对agent资料的分析,就可以确定蜘蛛的种类.性别等因素,我们在通过数据库或者文本来记录就可以进行统计了. 数据库结构: # # 表的结构 `naps_stats_bot` # CREATE TABLE `naps_stats_bot` ( `botid` int(10) unsigned NOT NULL auto_in

PHP记录搜索引擎蜘蛛访问网站足迹的方法_php技巧

本文实例讲述了PHP记录搜索引擎蜘蛛访问网站足迹的方法.分享给大家供大家参考.具体分析如下: 搜索引擎的蜘蛛访问网站是通过远程抓取页面来进行的,我们不能使用JS代码来取得蜘蛛的Agent信息,但是我们可以通过image标签,这样我们就可以得到蜘蛛的agent资料了,通过对agent资料的分析,就可以确定蜘蛛的种类.性别等因素,我们在通过数据库或者文本来记录就可以进行统计了. 数据库结构: 以下为引用的内容: # # 表的结构 `naps_stats_bot` # CREATE TABLE `na

域名不能访问的可能性原因分析

文章描述:域名不能访问的可能性原因分析. 终于解决了域名不能访问的问题,柳暗花明又见杏花村,整整历时7天正好一个星期,期间心情那是一个起起落落.跌跌荡荡,简直是苦不堪言,总是解决不了. 每次访问就出现whitechilliesdesign的页面,现在搜索这个词我的网站还排在第二呢,为了解决这个问题我无数次尝试,一次次被打击,最后发现了问题是在DNS解析服务器上面,空间商给了我两个DNS解析服务的地址,其中一个挂掉了还是怎么了就是不能用了,这也是造成我反反复复修改设置都不能发现最终原因的根本原因,