网站收录差 网页相似度在作祟

  很多站长在某个时间段会一直纠结自己网站收录量上不去。一个网站内部网页的相似度决定了你的网页让搜索引擎容不容易收录。站长现在用的比较多的是php和asp程序来做网站,有的用了全站模板,有的整个栏目就用了一个模板,这些势必导致我们的网页有很多相同的地方。据我们对搜索引擎的收录原理了解,假如一个网站太多重复的页面势必会导致该站的收录降低,关键词排名降低,也就是我们常说的降权。究竟是哪些东西导致我们网页的相似度很高呢?

  第一, head部分。在我研究seo的这段时间里,我发现很多站长在列表页和内容页采用统一的关键词和关键词描述。这里就占了网页相似度的10%。接着,我们继续分析。

  第二, 导航栏和侧边栏部分。是的,当我们流量很多网站在内容页时,的确整个站的内容页都是同样的导航栏,侧边的一些推荐文章或产品都是同样的。这里又占了网页相似度的10%。

  第三, 网页的底部。我想我说到这里,大家应该很清楚了,有的网站采用了全站foot.html模板,是不是整个站的底部都是同样友情链接,同样的备案信息,同样的公司名称等。这里就占了网页相似度的5%~10%。

  我们通过以上的分析,我们可以知道就算我们不添加内容,该新网页就与以前的网页相似度达到了25%~30%。试想一下,我们更新和以往类似的文章,搜索引擎还会来收录吗?就算我们现在更新的内容与以前的相似度是50%,那么整个网页的相似度就达到了75%~80%的这么一个高度。为什么当我们更新这类文章的时候,搜索引擎很快就收录了,但是整个网站的收录还是保持原样。举一个例子,我在当天更新了5篇文章,搜索引擎收录了5篇,网站的总收录为1000篇,按照理论上我们第二天的收录量为1005篇的,但是通过site命令一查,仍是1000篇的收录。后来通过分析,原来我们发现现在更新的文章的网页与之前收录的文章的网页他们之间的相似度达到了90%,搜素引擎收录了我们更新的文章,过滤掉了以前的文章的网页。可能搜索引擎觉得新更新的要比之前的有价值,所以选择了新更新的。

  这里我们就引发出一个问题了,为什么有些转载的文章也能被搜索引擎收录呢?很大一部分原因是该文章在这个网站从没出现过,再加上该文章在互联网转载的少,最后该文章与同类文章的相似度低。以上的针对的搜索引擎研究主要是百度,如果一个网页的相似度做到30%的话,那么你的网站在的收录量会提高1.5-2倍。对于搜搜和谷歌以及搜狗,效果会更明显。

  郑重申明:本文由湖南服务器租用www.chinaidcw.com供稿,转载请保留作者的著作权!

时间: 2024-11-08 20:20:41

网站收录差 网页相似度在作祟的相关文章

如何降低网页的相似度 从而增加网站收录

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 在我以前的文章<网站收录差 网页相似度在作祟>已经将到了三个主要引起网页相似度的原因.网页头部.网页侧边和导航以及网页底部,他们占了网页相似度的25%~30%.这一章,我会教大家如何降低网页的相似度,从而提升网站的收录.如今很多站长在建站的时候都会选择套用模板,就连关键词和网页的描述统一调用.所以,很多站长确实很苦恼自己明明是原创

网站收录率,是搜索引擎收录数量占网页实际数量的百分比

摘要: 网站收录率一直都是站长们津津乐道的话题,走进站长论坛.站长QQ群,基本上每天我们都可以听到关于收录方面的一些咨询或讨论.网站收录率,是搜索引擎收录数量占网页实际数量 网站收录率一直都是站长们津津乐道的话题,走进站长论坛.站长QQ群,基本上每天我们都可以听到关于收录方面的一些咨询或讨论.网站收录率,是搜索引擎收录数量占网页实际数量的百分比.用数学关系式可以表达如下: 网站收录率P(Percent)= 搜索引擎收录量(A)/网页实际数量(B) 在网页实际数量B固定的情况下,搜索引擎收录A的越

电商网站如何提高网页收录数量

大多数电商网站由于网站定位或产品结构等特点,普遍感觉自身网站页面收录数量低,当然对于电子商务网站来说有效收录页面数量越多越好,每一个页面相当于一个士兵,页面数量越多,那么赢得战争的几率也就越大,如何提高页面收录数量呢,这就需要具体情况具体分析: 1.对于某些垂直电商来说,由于产品结构单一,导致产品SKU数量较少,整体页面数量也较少,即使收录比例再高,也无法突破总页面数量的天花板,对于这样的电商来说解决方式有几个: A. 增加产品聚合页面数量,如:列表.专题.标签或者筛选等页面数量,这些页面基本上

浅析:网站收录量的影响因素

网站收录一直都是站长们关注的焦点,很多seoer都因网站收录量过少不稳定而整日忧心忡忡,花费大量的时间去寻找解决的方法,却不得其道.这是为什么呢?今天我就以一名老站长的身份给大家解释下是什么原因吧. 1.新站考核期 百度算法的更新对新站的收录也越来越严了,一周收录首页,两周开始收录内页已经成为常见的情况,并且内页收录速度非常慢.想要达到成百上千的收录量至少也得花费一个月以上的时间,近期我做的几个新站都是这样.一般新站考核期为三个月,3个月内收录不会变动太大,会在一定区间反复波动.当站长遇到这种情

张建飞:浅谈网站收录与排名

网站收录是站长们经常谈论的话题,每天打开电脑就是检查网站收录.外链.快照以及排名情况.站长们都希望收录越多越好,特别是更新的内容是否被搜索引擎收录.张建飞就此谈谈的自己的看法. 首先纠正下大多站长们的观点"网站收录了就会提高网站权重"这句话无可厚非,本身是没有什么问题,但是也导致了很多站长的误解,于是便造成了采集内容.软件伪原创等不管内容质量的恶果.由于内容质量差,从而提高了网站跳出率.收录被删除,最终降低了网站权重,其最坏结果是导致网站被K.所以不能一味的追求收录,收录有质量的内容是

网站推广之链接广泛度分析

链接|推广|网站推广 Internet的变化日新月异,其庞大的容量对搜索引擎的索引更新和服务无疑是一种考验.搜索引擎也一直在努力寻求创新的途径,例如以关联站点的广泛度为基础进行排名,以此抵消对搜索引擎的spam伎俩和对页面因素恶意操纵的不良竞争结果,达到为用户提供最为精准和相关的搜索结果的目的.如今,通过将链接广泛度这个因素整合到其排名算法中,搜索引擎(例如Google)已然能够为冲浪者们提供卓越的搜索经验. 但这并不意味着我们就可以对页面因素和网站内容掉以轻心.正确的理解应该是:对于两个页面优

浅析网站收录的影响因素(一)

网站不收录怎么办?权重不够,买点友链;外链不够,多发点;文章不是原创,好好写.一个问题,有那么多的答案,可是我们不能靠猜测去工作.今天我给大家说说我认为的网站收录的影响因素. 很久以前光年论坛的张国平老师就提出一个公式:网站收录量=页面抓取量×页面质量.收录本来就是靠蜘蛛抓取,能被蜘蛛留下的页面就是质量高的,这个公式的正确是大家不会怀疑吧?我们来看下面的分析. 页面抓取量应该和你的服务器,网站程序有关系的,如果它们对百度蜘蛛的访问不干涉.不限制,都很正常很稳定.另外外链的作用呢,基本就是两点1.

浅谈百度刚收录的网页排名波动的猜想

网站排名对于站长来说,都是最关心的一件事,无论在什么时候,做什么事,一切都是为了网站排名,我也如此,淘宝减肥超市上线有两个月了,目前主要是经营减肥相关产品的,大家可以了解了,做减肥产品的网站有很多,可以说这个是非常有竞争力的吧,甚至说做这种站就是找死.呵呵,没关系,我是兼职做的,锻炼一下自己的水平.即使,没做成功,我亏损的只是时间而已. 截止到今日,这个网站收录情况还算很不错了,目前总收录量是248,百度快照时间大约是10分钟左右,以下图为证: 可见,百度还是喜欢我这个站点的,对于已经收录的这个

百度搜索引擎对网站收录下降如何解决

站长朋友都知道,搜索引擎无时无刻都在更新,一直进行着收录有价值页面.剔除无价值页面的动作.而且每周都会有一次中等规模更新,一般在周四或周五,每个月的月初和月末还会有一次较大规模的更新.通过站长工具查看"seo数据风向标",百度每天减少比例与增加比例正常情况下是相差不大的,也就意味着每天都会有很多页面被删除,百度最近的几次更新,K掉的网页比例非常高,以至于目前很多站长都在抱怨.   网站收录及删除原则 要解决这个疑问,我们首先需要明白"百度的收录过程".搜索引擎对页面