Google PageRank 算法解析

     什么是PageRank?
    PageRank是Google衡量网页重要性的工具,测量值范围为从1至10分别表示某网页的重要性。在Google工具栏可以随时获得某网页的PageRank值。在这里我们将PageRank的一些特殊之处,从而对其能够获得较为深入的了解,使广大用户能够更好的使用和了解Googel。
 
     网站排名的历史渊源
  上世纪90年代早期网络刚刚兴起之时,每天都有大量的含有特别行业内容的站点发布于网上。网上冲浪者却没有相应的工具定位这些他们认为存在的,但是却没有办法找到域名或网址的站点。到了1993年,雅虎诞生了。雅虎的诞生为网民减轻了这些烦恼。雅虎最初将每一个它所找到的网站,按照所属的分类目录进行划分组织,建立起一个整洁的、可以逐级查找的数据库,雅虎同时也在网站上置入一个 搜索引擎可以根据数据库中存在的“关键词”搜索到网站。接着其他搜索引擎如Altavista ,Excite, Lycos等也相继推出供用户使用的搜索工具。他们中的大多数是根据找到的元标识中的关键词来识别网站的相关性。
 
  事情好像发展地很顺利,但是当站主及网管意识到可以在元标识中插入行业关键词或其他站点代码,就可以巧妙的得到搜索结果页面上的较高的位置的时候问题来了。有一段时间,搜索引擎的结果被这些垃圾网站搞得乱七八糟,他们用某些相关的关键词充斥于网站的各个角落,可是展现在用户面前的实际内容确实糟糕透顶。那些信用较高、地位重要的搜索引擎开始受到挑战,他们必须采取更好的措施精确为用户输出的搜索结果。
 
  Google网页级别祥解
  Google意识到了传统搜索引擎所面临的这种问题。如果相关性有网管来控制的话,那么排名结果必将被他们人为安排的大量相关关键词所污染,掩蔽了真正的相关性。
 
  网络的本质就是超链接。我们从逻辑上分析,每个人都让自己的网站与某些重要的站点相链接,那么,本质上,这个站点就投了对方的一票。当上百上千个站点链接到这个站点时,我们认为这个站点是一个很好的很重要的站点也就非常符合逻辑了。
 
  就是在这样的逻辑推理下,Google的两位创始人Sergey Brin及Larry Page建立了一个搜索引擎算法公式,即将排名比重转移到了网页意外的因素上。他们的公式被命名为“PageRank”(以创建人Larry Page的名字命名)。Google就是利用这一公式计算链接到某一网页的网站数量,然后按照从1-10分别给予表示重要度的分数。链接到网页的站点越多,PageRank的分数越高。

时间: 2024-11-10 00:10:45

Google PageRank 算法解析的相关文章

PageRank 算法解析

PageRank 算法解析    Jun 26, 2005 来源:未详         什么是PageRank? PageRank是Google衡量网页重要性的工具,测量值范围为从1至10分别表示某网页的重要性.在Google工具栏可以随时获得某网页的PageRank值.在这里我们将PageRank的一些特殊之处,从而对其能够获得较为深入的了解,使广大用户能够更好的使用和了解Googel. 网站 排名的历史渊源 上世纪90年代早期网络刚刚兴起之时,每天都有大量的含有特别行业内容的站点发布于网上.

TSPR理论-如何应对Google PageRank排名新算法(二)

原著:Dan Thies编译:Karen 第二部分: 探索Google PageRank新算法(上)---对Google的新排名算法有多种猜测.此文仅做抛砖引玉之用.2-1. Google的主题性趋向2-1-1. 关于页面级别(PageRank)及Google的旧算法出现问题的原因 页面级别(PageRank)计算系统所遵循的思路是:通过一个经由互联网的"随机运动"来告诉你哪些站点是最重要的.该系统模拟的是一个随机冲浪者跟进点击某页面上的随机链接,至最深层页面时按"返回&qu

Google PageRank排名新算法(二)

第二部分: 探索Google PageRank新算法---对Google的新排名算法有多种猜测.此文仅做抛砖引玉之用.2-1. Google的主题性趋向2-1-1. 关于页面级别(PageRank)及Google的旧算法出现问题的原因 页面级别(PageRank)计算系统所遵循的思路是:通过一个经由互联网的"随机运动"来告诉你哪些站点是最重要的.该系统模拟的是一个随机冲浪者跟进点击某页面上的随机链接,至最深层页面时按"返回"按钮这一过程.页面的等级越高,则随机网络冲

Google的PageRank算法无所不能?

摘要: 1998年,两个名不见经传的研究生,Larry Page和Sergey Brin,第一次在学术论文上介绍了Google这个搜索引擎,而关键创新点就在于他们发明的名叫PageRank的算法(PageRank是Larry Page的Page,而不是 1998年,两个名不见经传的研究生,Larry Page和Sergey Brin,第一次在学术论文上介绍了Google这个搜索引擎,而关键创新点就在于他们发明的名叫PageRank的算法(PageRank是Larry Page的Page,而不是网

TSPR理论-如何应对Google PageRank排名新算法(三)

原著:Dan Thies编译:Karen 第三部分: 如何在Google新算法中拔得头筹如何应对Google的新算法?大家可以根据下面所列的一些要点采取相应的措施.3-1. 关键词的研究:扩大覆盖面搜索引擎策略的中心思想是确定恰当的关键词来锁定目标群体.但有很多网站管理员却在这一步上掉以轻心,只在屈指可数的几个平平常常的关键词身上铆足了劲,却不知这种策略失之偏颇.关键词研究的主要目标应该是确定目标群体所有可能使用的关键词,其中包括了品牌名称.地理位置及修饰语等"修饰成分".尽管对网站的

Google PageRank排名的新算法(三)

第三部分: 如何在Google新算法中拔得头筹如何应对Google的新算法?大家可以根据下面所列的一些要点采取相应的措施.3-1. 关键词的研究:扩大覆盖面搜索引擎策略的中心思想是确定恰当的关键词来锁定目标群体.但有很多网站管理员却在这一步上掉以轻心,只在屈指可数的几个平平常常的关键词身上铆足了劲,却不知这种策略失之偏颇.关键词研究的主要目标应该是确定目标群体所有可能使用的关键词,其中包括了品牌名称.地理位置及修饰语等"修饰成分".尽管对网站的每个页面只能围绕两到三个关键词进行关键词优

从赌钱游戏看PageRank算法

谈到并行计算应用,会有人想到PageRank算法,我们有成千上万的网页分析链接关系确定排名先后,借助并行计算完成 是一个很好的场景.长期以来,Google的创始发明PageRank算法吸引了很多人学习研究,据说当年Google创始者兴奋的找到 Yahoo!公司,说他们找到一种更好的搜索引擎算法,但是被Yahoo!公司技术人员泼了冷水,说他们关心的不是更好的技术, 而是搜索的盈利.后来Google包装成了"更先进技术的新一代搜索引擎"的身份,逐渐取代了市场,并实现了盈利. 由于PageR

【原创】机器学习之PageRank算法应用与C#实现(1)算法介绍

考虑到知识的复杂性,连续性,将本算法及应用分为3篇文章,请关注,将在本月逐步发表. 1.机器学习之PageRank算法应用与C#实现(1)算法介绍 2.机器学习之PageRank算法应用与C#实现(2)球队排名应用与C#代码 3.机器学习之PageRank算法应用与C#实现(3)球队实力排名应用与C#代码  Pagerank是Google排名运算法则(排名公式)的一部分,是Google用于用来标识网页的等级/重要性的一种方法,是Google用来衡量一个网站的好坏的唯一标准.在揉合了诸如Title

【原创】机器学习之PageRank算法应用与C#实现(2)球队排名应用与C#代码

在上一篇文章:机器学习之PageRank算法应用与C#实现(1)算法介绍 中,对PageRank算法的原理和过程进行了详细的介绍,并通过一个很简单的例子对过程进行了讲解.从上一篇文章可以很快的了解PageRank的基础知识.相比其他一些文献的介绍,上一篇文章的介绍非常简洁明了.说明:本文的主要内容都是来自"赵国,宋建成.Google搜索引擎的数学模型及其应用,西南民族大学学报自然科学版.2010,vol(36),3"这篇学术论文.鉴于文献中本身提供了一个非常简单容易理解和入门的案例,所