搜索引擎收录网页与网页权重之间存在着本质的区别

摘要: 搜索引擎收录网页与网页权重之间存在着本质的区别,也就是说收录不是权重,权重不是收录。 以前本人常常强调权重的重要性,并鼓励网站不要流失权重。但是却少有提及让搜索引擎

搜索引擎收录网页与网页权重之间存在着本质的区别,也就是说收录不是权重,权重不是收录。

以前本人常常强调权重的重要性,并鼓励网站不要流失权重。但是却少有提及让搜索引擎收录更多网页的问题,因此,在本文中,笔者会从不同的角度谈该问题。其实收录与权重有着非常大的区别,从一个简单的说法来说即,收录量决定着网站内容在检索结果中出现的频率和次数,而权重决定排名。举一个很简单的例子,一个IT界的门户网每天都会有将近500篇文章诞生,随着它们的产生,一些页面会自动创建,如标签页,这样这个网站每天有将近1000页新网页,而在这1000页中,搜索引擎收录了500页,搜录率只有50%。而另外一个还算不错的网站,每天将近有50篇网页诞生,但搜录40篇,搜录率80%。可是实际上,在搜索引擎检索结果中,前面的IT门户网的占有率大很多,但由于后一个网站质量很好,且权重较高,得到了很好的排名。

搜索引擎的收录量有哪些因素?

搜索引擎的搜录是有规律的,第一条就是吸引蜘蛛,这也是最难的一条。吸引蜘蛛有捷径可循,但吸引蜘蛛之后,另外一件事是让搜索引擎将抓取的网页建立索引,加入它自身的数据库中。那么,是什么影响这搜索引擎的收录呢?

1.蜘蛛访问的次数与频率:这是绝对前提,如果蜘蛛不访问网站,无从谈起收录了。当然,蜘蛛访问网站会消耗掉网站的流量,且会加大服务器的负担。因此,我们要做的应该是让蜘蛛养成定期循环访问网站的习惯,例如在每天晚上睡觉前访问网站,了解网站更新了哪些内容。

2.蜘蛛访问的深度与广度:蜘蛛就是搜索引擎抓取网页信息的一种机器人程序,它在抓取网页信息时,常常具有挑选性,例如蜘蛛会根据网站信息的深度来判断当前网页的重要性,并判断是不是要收录它。同时,蜘蛛还会显示出不耐烦情绪,当网页内的哪些干扰信息比较多,如广告、JS代码等,蜘蛛会选择暂停抓取。

3.网站或栏目甚至网页的权重:权重会影响收录,主要体现在高权重的网页会让蜘蛛停留更长的时间,并削弱它的挑选性,更会消除它的不耐烦。但是网页的权重是经过长期积累起来,且要有合理的网站权重规划。

4.网站信息产生的速度与质量:权威人士撰写的网站内容,例如著名作家、谷歌内部的工程师等,他们的网站更新速度慢,但搜录很快,且较为全面。

虽然上述是从搜索引擎的角度,强调收录的搜索引擎主动的,而非以网站拥有者的意志为转移。网站拥有者只能顺从搜索引擎,掌握那些蜘蛛的规律,按规律办事,或许这样能得到搜索引擎的亲睐。

如何看待收录与权重

收录是权重的基础,因为没有收录量,再高的权重都没有意义(当然这是不可能的)。权重能反过来刺激收录量,这在上文已经提到过了。但在这里,有一个概念性的误解需要被澄清:本站所提到权重和收录偶尔会引起读者误解,特别是在传递权重时,我们往往希望搜索引擎不收录一些网页,或不要将权重传递给某些网页。那么接下来,我们就来看看收录是如何产生的,权重是如何传递的。

收录,顾名思义就是让网页被收集记录到搜索引擎数据库中,在这个过程中,搜索引擎会对网页信息进行索引,即确定该网页和哪些关键字相关。在搜索引擎蜘蛛爬行时,首先会检查网站的robots.txt文件,以确定网站管理人是否希望搜索引擎不要收录其中的一些或全部网页。除此之外的所有网页都可能被收录,只要蜘蛛能到达这个页面(实际上由于上述的一些蜘蛛特性,很多网页是到不了的)。因此,我们最好让网站的每一个我们想被收录的页面都可以从首页通过点击链接访问到。而且有一个特点是,距离首页的点击次数越少,收录的机会越大。

权重,是搜索引擎给予一个网页的评估值,这个权重可以反映出网页的重要程度,权重越高,说明获得更多搜索引擎的信任和认可,在排名时获得更好的排名。关键是,权重是怎么传递的。一般来说是通过链接,特别是带锚文本的链接(超文本链接,链接文本现在也被计入传递权重的范围)。但权重的传递不是等价平均的传递的,而是经过计算后传递的。例如某页面A的权重为1.00,而它链接到10个页面,这10个页面将获得总和为5~6的权重值,它们也不是完全平分这5~6分,而是各不相同。有的可以继承2的权重值,有的可能只能继承0.5的权重值。

需要强调的是,凡是链接,都会传递权重,而且权重值会被分散到所有链接身上。就像上文所述的权重值,在这5~6分中,如果有100个链接来分摊它,那么每个链接分摊到的分数会很小,即使权重传递不平均,但最高也会低到0.01级。可是,我们并不愿意减少链接数来使分摊者变少,我们可以使用rel=”nofollow”来阻止权重传递,也就是让这100个链接有40个链接不传递权重,那么只剩下60个链接来分摊这5~6分的权重,虽然每个页面得到的权重仍然很小,但总比更小要好。

1.收录和权重的误区 认为rel=”nofollow”不会被收录:实际上它只负责阻止传递权重,而并不阻止收录链接所在页。为了阻止通过链接收录站外链接,我们往往将站外链接处理为一个站内的跳转页面,用robots.txt阻止这一系列的跳转页面,最终防止收录站外链接。

2.认为只要不收录就和权重没关系:现在很多网站存在一个严重的问题,就是权重黑洞。即一些网页内的链接连接到一个不收录的页面或没有权重传出的页面。如果一个页面的权重传递到一个不收录的页面,那么这些权重就浪费了,权重在这里进入终结。最好的是权重能在网站内部不断的流动,最终回到首页或要优化的目标页面。

3.网页跳转没有关系:使用meta refresh、header()、window.location.href都是不明智的,这些跳转会造成权重流失。

无论如何,收录量和权重在SEO里面是一对非常关键的概念,一方面要充分把握好它们在SEO中重要地位,另一方面,应该避免它们造成的损害。

文章来源奢侈品http://s.n6188.com/,转载请注明!

时间: 2024-10-01 19:00:50

搜索引擎收录网页与网页权重之间存在着本质的区别的相关文章

网站收录率,是搜索引擎收录数量占网页实际数量的百分比

摘要: 网站收录率一直都是站长们津津乐道的话题,走进站长论坛.站长QQ群,基本上每天我们都可以听到关于收录方面的一些咨询或讨论.网站收录率,是搜索引擎收录数量占网页实际数量 网站收录率一直都是站长们津津乐道的话题,走进站长论坛.站长QQ群,基本上每天我们都可以听到关于收录方面的一些咨询或讨论.网站收录率,是搜索引擎收录数量占网页实际数量的百分比.用数学关系式可以表达如下: 网站收录率P(Percent)= 搜索引擎收录量(A)/网页实际数量(B) 在网页实际数量B固定的情况下,搜索引擎收录A的越

增加网页被搜索引擎收录的机会

一个是网站互换链接推广方法效果的递减效应,另一个是搜索引擎排名政策对网站链入数量权重可能降低所带来的影响.这两个问题最终的结果都是一样的,即网站链接推广策略的有效性在降低.该文中同时也提到,通过交换链接获得合作伙伴的认知和认可,是一个网站http://www.aliyun.com/zixun/aggregation/12972.html">品牌价值的体现,那么是不是网站互换链接推广方法在获得网站访问量和潜在访问量(如搜索引擎排名优势)方面真的已经失效了?本文分析了增强网站链接推广策略有效性

Google如何收录及排序网页

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 我们遇到的最常见的问题之一是"Google是如何判定哪个结果出现在搜索结果的前茅?",Matt Cutts给我们简单地揭示了如何抓取.收录和给网页评级. 抓取和收录 当你看到出现在Google的搜索结果的那个网页之前,Google在后台已经做了许多步骤.Google的第一步是抓取和收录互联网上的数十亿的网页,这个工作时由G

如何制作符合搜索引擎优化需求的网页

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 网页优化是提高网站运行效率的一个重要环节.如何网页过大,那么就会导致很长的下载时间,导致网站打开过慢,既不利于蜘蛛的爬行,也不利于用户的体验,这在搜索引擎优化中是一件避讳的事情,那么,如何得到较小的网页文件,使得较短的下载时间,并使网页利于搜索引擎的检索,就是新手们必须面对的问题,事实上,制作网页前应统筹规划页面内容,控制文件大小,并从图像处

android如何获取网页中特定标记之间的代码并作为字符串返回?

问题描述 android如何获取网页中特定标记之间的代码并作为字符串返回? 比如 我要获取某个网页上fhh jkl 这两个标记之间的代码 并返回该怎么弄? 解决方案 正则表达式提取 (?<=fhh).*?(?<jkl) 解决方案二: 除了用正则之外你也可以用Jsoup提取

完善的索引机制 百度为什么要收录我们的网页?

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 百度收录是所有SEOer和站长魂牵梦绕的话题,尤其是最近很多朋友在抱怨百度不收录新站.然而,我今天想探讨这样一个话题:百度为什么要收录我们的网页?只有想明白了这个问题,我们才能有的放矢的改进我们的工作.百度为什么要收录我们的网页?我的看法是,百度要建立一个完善的索引机制. 有的人可能会说,你错了,百度收录我们的网页是为了对我们的网页进行筛选.

制约网站被搜索引擎收录的7个因素

每个做过网站优化的SEOER,不管优化的是新站还是老站,网站整体网页的被搜索引擎收录的收录量都是考核一个网站优化的基本指标,而且一直以来很多的SEOER都在纠结于自己网站的网页收录量,哪么制约网站被搜索引擎收录的因素有那些呢?牛人小鱼这里总结下很多站长和自己实践的一些心得. 因素1:robots文件 站长的误操作,这里的误操作应该就是robots文件的写法,很多网站的收录有很打一部分是因为robots写法出错,屏蔽了蜘蛛对网页的抓取. 因素2:网站域名整体权重 网站域名的整体权重不够,这里牛人小

浅谈影响搜索引擎收录网站内容的四大原因分析

最近网站内容收录实在是不理想,简单分析了一下原因作了一份报告提交给自己上司,那么这份报告呢,也做一份写作,相信的写一些影响搜索引擎收录网站的内容吧,毕竟有的网站内容迟迟不会收录,那么这里呢,肯定是有原因的. 一:网站域名权重 在我们网站之中,site数据的时候,总是看到远远小小本身网站内容的数据,有一种情况造成了这种现象,那就是域名权重,我常说域名权重很重要,在百度排名之中占据了很重要的位置,所以你的域名权重降了,被打进了沙盒,那么可能有以下的情况,网站当天收录,然后第二天删除,或者明明看见蜘蛛

谈谈搜索引擎收录减少的处理办法

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;   搜索引擎建立网页索引,处理的对象是文本文件.对于网络蜘蛛来说,抓取下来网页包括各种格式,包括html.图片.doc.pdf.多媒体.动态网页及其它格式等.这些文件抓取下来后,需要把这些文件中的文本信息提取出来.准确提取这些文档的信息,一方面对搜索引擎的搜索准确性有重要作用,另一方面对于网络蜘蛛正确跟踪其它链接有一定影响. 对于doc.pdf等文档,这种由专业厂商