摘要: 笔者在平时的优化过程中并不看重快照这一项,百度站长社区曾经也发表过声明《关于百度快照问题的若干说明》,详细的指出了百度是如何更新一个网站的快照以及快照更新的意义,
笔者在平时的优化过程中并不看重快照这一项,百度站长社区曾经也发表过声明《关于百度快照问题的若干说明》,详细的指出了百度是如何更新一个网站的快照以及快照更新的意义,笔者这里就不去一一道来,有兴趣的可以去百度站长社区的资料区去看看!
但是最近笔者发现一个很奇怪的现象:笔者的个人博客快照每天都在更新,但是预览快照却发现内容是很久以前的,并不是即时的。
快照更新日期与提取内容
上图是笔者博客的快照更新日期,大家可以看到是隔天更新的,而且提取的内容也是笔者博客昨天才发的文章,说明百度蜘蛛确实抓取了首页内容,但是点开百度快照我们会发现:
快照预览显示情况
这个博客主题是笔者上个月用的主题,在元旦就已经换成现在的主题了,如下图:
博客实际内容
理论上,笔者的博客快照更新了,抓取的内容也是即使更新的,但为什么快照的预览却是滞后的呢?这个问题很有趣,笔者以前还没有遇到过,这次遇到了,就索性来探究探究,以下观点都是笔者的个人猜测,不一定完全正确,有什么异议大家可以提出来一起研究。
一、网站改版,标题改动
笔者的博客在2012年末的时候进行了一次很大的变动,首先是换了关键词,换关键词的第二天百度就更新了,并无任何影响,快照也是很正常,然后在元旦的前几天,笔者因为要博客实现很多功能,以前的主题太过简洁,实现不了就换了主题。主题更换了之后,快照日期也是一直更新,但笔者很少去预览,最近才发现,更新的并不是新主题的预览,还是以前的老主题,但是网站的首页内容还是抓取了的,大家看第一个图就知道了。
于是,笔者猜测是不是因为网站的频繁改动导致快照错误,百度每个新抓取或者新检查过的网页,都会根据其重要程度以及其时效性价值以不同的速度去创建索引,通常所说的快照更新时间是指索引时间,对于一些经常有重要内容更新的网页,百度会以更快的速度创建索引。但是对于一些变动频繁的网站,百度是不是有一种惩罚的方式呢?很显然笔者的博客就是这样的!
二、 百度快照数据调用混乱
大家都知道,对于每个重要网页的快照往往会在搜索引擎数据库中保存有多份网页快照,这些快照的抓取时间并不相同。在一些极特殊情况下,搜索引擎系统可能会选择不同于当前搜索结果中的快照版本,导致出现快照时间倒退的情况。百度特地声明了这对网站在搜索引擎中的表现无任何影响,也并不代表搜索引擎对该网站做了降权处理。那么像余斗这样的网站出现这样的问题,虽然快照时间更新了,但是快照的预览却调用的是半个月前的,会不会是百度数据的问题?就这个原因,余斗咨询了部分同行,发现也有人有同样的问题,他们给出的答案也有百度数据混乱。
三、 快照不能说明一切
余斗看了自己的网站索引发现一个有趣的现象:
基本是每天都掉一两个,然后每周五更新的时候增加数十个,网页快照其实也是百度数据库中的一条索引,余斗的网站索引量自从改版之后一直在降,是明显的被惩罚的表现,但每次更新的时候都增加很多索引,余斗坚信自己的博客文章被抓取了,并未放出而已,现在还只是观察期,快照出现这样的怪现象也很合理,余斗只要坚持更新博客,做好原创,不久一定会恢复正常!
以上三个原因是余斗所能总结出来的,网站快照日期更新内容不更新并不是什么大问题,如果你的网站确实出现过变动,这都在情理之中,如果没出现变动却也是这个现象,那么你就要注意多加更新高质量内容,做好优化工作了!快照的更新与页面中是否出现重要新增内容有直接关联,而与网站本身的“权重”、是否“被K”并无直接关联。所以站长朋友们不必过多关注网站的快照时间及内容,余斗建议站长将精力集中在网站的内容建设中,只有提高网站的内容价值和检索体验,方可受到用户和搜索引擎的信赖。