说到百度快照,站长们们都知道他的重要性,是百度权重的重要因素之一,也是交换友情链接,衡量网站的重要标准。及时快照更新直接表示站点被蜘蛛抓取的频率,受蜘蛛的喜欢程度。闲话不说,今天就给大家分享我的站点首页快照抓取异常,只有网址无标题描述的,快照停止的解决过程。
话说我的站点中国纺织人才网向来快照更新都是比较及时的,偶尔会落后几天,但是恢复的也很快,但是前段时间,输入主关键词时候,出来的快照是9月12号的,还没有描述,只有一个网址以及名称,奇怪,这什么情况?连一直以来都有的ICO标签也么有了,这美观度是其次,这种情况直接影响客户对网站信任度啊,我开始关注这个问题。
首先网站有问题,得先用工具查一下,我通过chinaz站长工具查询网站的死链接,友情链接,这两块是我们每周都有做维护的,用工具都检查一遍,同时也用站长工具中查看索引量以及抓取异常情况,并么有发现什么很大的波动。这些指标都没有明显变化,那难道是站点内部出现什么问题?说道这个不得不推荐谷歌管理员工具,相信很多站长们都有用这工具,他们的抓取错误提示上比较快,有什么问题基本上都是能及时通知的。
谷歌管理员工具分析后,发现我们的站点内部有很多的404 页面,很多都是以前修改路径时候遗留下来的问题,同时也是因为近期服务器问题比较多, 访问上都有不稳定的情况。谷歌管理员工具有一个好处,告诉你404 页面后,还有链接到该页面的域名,可以然后快速找到并处理问题,404 对整站的影响自然不需要我多说,就是和毒瘤,少的时候没什么,爆发起来就是突然就降权了。
到此,我想基本上应该解决一部分了,过了2天,当我在百度上输入时候,我以为他能好了,可是以为只是以为,现实总是更加骨感,这次情况更糟糕,直接网址查的快照竟然也是9月12号的,这下我慌了,难道还有什么问题?
接下去就是下载IIS访问日志,关于IIS日志这块,我也是一直以来都看的比较少,但是网站有问题,不会看也得看啊,毕竟日志是蜘蛛情况最直接的反馈。下载好日志,我首先用光年日志工具分析了,学着看每个目录的访问情况,说到日志这块每个站长都有自己习惯的工具,不外乎是分析每个目录下面的返回码,我们主做的百度,自然主要分析百度蜘蛛的访问情况。
首先是304页面,分析站点的时候发现很多304的返回码,304 百度了下,是属于页面请求不更新的情况,304多,蜘蛛长期吃不到新的东西,就会导致网站快照更新不及时的情况。另外一个代码,是经理发现的,他采用的是不用工具直接查看源码的发放,这回就发现index目录也就是纺织人才网首页大量的200 0 64 ,关于200 0 64网上的说法不一,我也是问了群上的很多人,有人说是正常的,也又说的异常的,比较多的说法是抓取不完全,也就是说蜘蛛来到页面,抓到了信息但是在带走过程中遇到了问题,也就是没有返回信息。在结合自己站点情况,这就是问题了,页面不更新,蜘蛛抓取异常。
问题出来了,接下去就是解决问题,分析了我们纺织人才网的首页,每日更新的板块真的很少,毕竟客户就那些客户,有增加也不会每日添加到首页的。但是首页问题还是得解决,怎么办,就增加新的板块,增加一个能实时更新的内容,于是策划效果也制作内容上线,然后去百度快照投诉,在过了几天,看快照渐渐恢复,目前为止基本正常。
总结这次经验,怎么说呢百度快照不正常,有多种原因,有时候可能只是百度自己有问题,但如果快照3天以上异常,就得开始考虑是不是站点内部问题了。同时在检查问题的时候,一定得多方面考虑,把可能的问题都一一排查。而且出问题,一定得看日志,因为日志比你所有的工具都能反映真实情况,多方面综合,总有一样是能真正解决问题的
本文作者:中国纺织人才网www.texhr.cn A5首发,转载请保留版权信息。