Google PageRank排名新算法(二)

第二部分: 探索Google PageRank新算法
---对Google的新排名算法有多种猜测。此文仅做抛砖引玉之用。
2-1. Google的主题性趋向
2-1-1. 关于页面级别(PageRank)及Google的旧算法出现问题的原因
页面级别(PageRank)计算系统所遵循的思路是:通过一个经由互联网的“随机运动”来告诉你哪些站点是最重要的。该系统模拟的是一个随机冲浪者跟进点击某页面上的随机链接,至最深层页面时按“返回”按钮这一过程。页面的等级越高,则随机网络冲浪者发现它的机率亦越高。
这种思路其实相当富有创意。一个网页的外部链接越多,则对任意网络冲浪者来说,发现它的机会也就越大。同时,在页面级别算法系统中,页面越流行,则其导入链接就越能从链接中受益—这是由于任意网络冲浪者发现这些链接的机会就越大。
在特定领域的研究论文查询方面,页面级别系统几乎无可挑剔。例如,如果用户查询关于素粒子物理学研究方面的论文(或网页)文献集,则对于一个给定条件的查询,页面级别的算法可以很快告诉你,哪些论文才是与该特定查询条件最相关及最重要的论文,其原因就在于这些论文较其它论文的引用次数要多。
若互联网上的资源具有同一主题性,那么这种工作可说是尽善尽美了。但正如我们所知道的,互联网上的资源涵盖了上百万甚至更多的主题,而且在人们的实际生活中,查询用户所寻找的往往是一些具有特定主题的信息。所以虽然页面级别系统考虑了所有链接,但却忽视了链接页面的主题性。
Google已试图将链接的文本内容计入排名算法来克服这一局限性。但精明的搜索引擎营销商却通过在网络上到处建立充盈关键词的链接来欺骗Google的排名算法。一种新的作坊式行业也随着PageRank应运而生—即有偿交换和交易一些来自较高“页面级别”页的链接。
如果网站能够从毫不相关的站点购买或交易导入链接而使网站排名得到提升的话,那么页面级别技术已然无法为绝大多数查询条件提供高质量的搜索结果了。我们有理由相信,当Google这个世界最顶级的搜索引擎一旦发现其搜索结果的质量开始恶化时,它是不会坐视不管的。
2-1-2. 新技术闪亮登场:主题性页面级别技术(Topic-Sensitive PageRank)
2002年,斯坦福大学的一名博士生塔赫尔。哈维利瓦拉(Taher H. Haveliwala)发表了一篇非常有意思的论文,名为“Topic-Sensitive PageRank(主题性页面级别计算系统)”。而更加有趣的是,一年之后哈维利瓦拉成了Google的一份子。
“主题性页面级别计算系统”通过对随机查询用户的随机运动增加一个“偏差”来处理基本的页面级别计算系统所存在的问题。这个新的随机查询用户具有明确的查询目的,并更感兴趣于跟进那些具有某个特定主题的相关网页上的相关链接。这是一个相对而言较为新颖的思路,它解决了搜索结果的质量性方面的一系列关键性问题。

时间: 2024-08-09 20:41:55

Google PageRank排名新算法(二)的相关文章

TSPR理论-如何应对Google PageRank排名新算法(二)

原著:Dan Thies编译:Karen 第二部分: 探索Google PageRank新算法(上)---对Google的新排名算法有多种猜测.此文仅做抛砖引玉之用.2-1. Google的主题性趋向2-1-1. 关于页面级别(PageRank)及Google的旧算法出现问题的原因 页面级别(PageRank)计算系统所遵循的思路是:通过一个经由互联网的"随机运动"来告诉你哪些站点是最重要的.该系统模拟的是一个随机冲浪者跟进点击某页面上的随机链接,至最深层页面时按"返回&qu

TSPR理论-如何应对Google PageRank排名新算法(三)

原著:Dan Thies编译:Karen 第三部分: 如何在Google新算法中拔得头筹如何应对Google的新算法?大家可以根据下面所列的一些要点采取相应的措施.3-1. 关键词的研究:扩大覆盖面搜索引擎策略的中心思想是确定恰当的关键词来锁定目标群体.但有很多网站管理员却在这一步上掉以轻心,只在屈指可数的几个平平常常的关键词身上铆足了劲,却不知这种策略失之偏颇.关键词研究的主要目标应该是确定目标群体所有可能使用的关键词,其中包括了品牌名称.地理位置及修饰语等"修饰成分".尽管对网站的

Google PageRank排名新算法

中介交易 SEO诊断 淘宝客 云主机 技术大厅 第一部分: 最新消息! Google的主要变化 Google的主要变化始于2003年11月的16号,从那时候起,网上论坛就开始对此议论纷纷并产生了形形色色的推测.这种更新对一些人是坏消息,而对另外一些人却是好消息(不过大多数猜测都来自于那些认为这是坏消息的人).Google对其变化只字不提,当然我们也别指望它会说点什么.因此,这篇文章代表了我个人的部分推测,希望它至少为读者您提供了一些"较为可靠的推测". 除了在对搜索结果的排名方式上有一

Google PageRank排名新算法(一)

第一部分: 最新消息! Google的主要变化 Google的主要变化始于2003年11月的16号,从那时候起,网上论坛就开始对此议论纷纷并产生了形形色色的推测.这种更新对一些人是坏消息,而对另外一些人却是好消息(不过大多数猜测都来自于那些认为这是坏消息的人).Google对其变化只字不提,当然我们也别指望它会说点什么.因此,这篇文章代表了我个人的部分推测,希望它至少为读者您提供了一些"较为可靠的推测". 除了在对搜索结果的排名方式上有一些显著变化外,Google在搜索结果的格式上亦有

GooglePageRank排名新算法(二)

中介交易 SEO诊断 淘宝客 云主机 技术大厅 做抛砖引玉之用. 2-1. Google的主题性趋向 2-1-1. 关于页面级别( PageRank)及Google的旧算法出现问题的原因 页面级别(PageRank)计算系统所遵循的思路是:通过一个经由互联网的"随机运动"来告诉你哪些站点是最重要的.该系统模拟的是一个随机冲浪者跟进点击某页面上的随机链接,至最深层页面时按"返回"按钮这一过程.页面的等级越高,则随机网络冲浪者发现它的机率亦越高. 这种思路 其实相当富有

“HillTop”论 - 探索Google排名新算法(二)

    此外,若两个站点均为相同IP地址下的宿主,则认为其中一个是另外一个站点的成员站点.(即:若ww.abc.comwww.ibm.com均为相同IP地址下的宿主,则认www.abc.com是www.ibm.co.uk的成员站点)     Hilltop算法的一个极其重要的特征在于:若没有找到搜索引擎 认为数量足够的"专家文件"(要求至少需有两票),则该算法失效,即返回结果为零.换言之,对于高度明确化的查询条件(查询词语),Hilltop算法的结果很可能为"0".

如何应对Google PR排名新算法

原著:Dan Thies编译:Karen 第一部分: 最新消息! Google的主要变化Google的主要变化始于2003年11月的16号,从那时候起,网上论坛就开始对此议论纷纷并产生了形形色色的推测.这种更新对一些人是坏消息,而对另外一些人却是好消息(不过大多数猜测都来自于那些认为这是坏消息的人).Google对其变化只字不提,当然我们也别指望它会说点什么.因此,这篇文章代表了我个人的部分推测,希望它至少为读者您提供了一些"较为可靠的推测".除了在对搜索结果的排名方式上有一些显著变化

Google PageRank排名新算法一

原著:Dan Thies 编译:Karen 第一部分: 最新消息! Google的主要变化     Google的主要变化始于2003年11月的16号,从那时候起,网上论坛就开始对此议论纷纷并产生了形形色色的推测.这种更新对一些人是坏消息,而对另外一些人却是好消息(不过大多数猜测都来自于那些认为这是坏消息的人).Google对其变化只字不提,当然我们也别指望它会说点什么.因此,这篇文章代表了我个人的部分推测,希望它至少为读者您提供了一些"较为可靠的推测".     除了在对搜索结果的排

“HillTop”论 - 探索Google排名新算法(一)

    编者按:2003的11月16号--这个日子可能会成为搜索引擎 历史的一个重要里程碑.正是在这次被大家称为" Google Florida"的更新中,Google对其排名算法进行了大规模改动,并导致很多原来排名很好的网站在一夜之间如梦魇般直落孙山.每个更新周期可能会对排名算法做一些小小的改动Google一贯的做法,但这次如此大手笔的改动,不能不让网站管理员乃至整个搜索引擎 优化行业都倍感震惊和始料不及.不但很多原来排名一直保持前矛的商业网站丢掉了排名,同时亦使得许多做网站排名优化