Google的PageRank算法无所不能?

摘要: 1998年,两个名不见经传的研究生,Larry Page和Sergey Brin,第一次在学术论文上介绍了Google这个搜索引擎,而关键创新点就在于他们发明的名叫PageRank的算法(PageRank是Larry Page的Page,而不是

1998年,两个名不见经传的研究生,Larry Page和Sergey Brin,第一次在学术论文上介绍了Google这个搜索引擎,而关键创新点就在于他们发明的名叫PageRank的算法(PageRank是Larry Page的Page,而不是网页的意思)。Google正是依据PageRank算法将搜索到的网站进行排序,正如他们二人所说的:PageRank“带来了网页新秩序。”

PageRank将网站的链接和超链接作为指标,衡量其重要性和权威性。然后Google根据此信息来排列搜索结果。Page和Brin发表的分析结果,并不只是当时现有数学的一个新的应用,学者们认为,他们找到的是一个全新的方法,虽然可能有借鉴一些前人的成果。

虽然Google对PageRank提供搜索结果的依赖程度到底有多少,只有公司内部的人才知道,但是,可以肯定的是,该算法对Google现在数千亿的市值起到了不可磨灭的作用。

而PageRank在网页之外,也具有惊人的大范围的实用性,几乎涵盖所有领域,从体育团队的排名到大脑内部交互联结的分析。

普渡大学的计算机学家David Gleich这么评价道:“它有点像是Google发明的镜头。如果你有各种不同的镜头随机组合,你就可以观察到各种不同的系统——就像是你同时有了显微镜,望远镜,数码相机等等。但你还是需要有自己独特的视角。”

自动论文发表以后,十六年来,Gleich一直在研究PageRank算法在其他领域的应用。他已经发现了数十种可以使用该算法的具体案例。他的做法并不是深入研究每一个实例的具体实现,而是为了证明PageRank确实拥有广大的适用范围。

他说,只要有图谱,就有PageRank的用武之地。它是一种数学的思维方式,代表了一组事物的关系或流程,研究对象可以是Web页面,办公室工作人员,Facebook的用户,基因,蛋白质或者交通情况。“PageRank就像各种图谱一样,无处不在。”

以下是一些有趣的使用案例。目前,这些对Google的商业或社会影响并没有产生什么作用,但也不排除会有这么一天。

文学作品

最重要的文学作品是什么?PageRank算法可以帮助回答这个看似很主观的问题。Nebraska大学的一位文学教授开发了一款软件,使用了PageRank和其他的算法。他的研究对象是十九世纪的文学作家。经过分析了近3600部长篇小说,软件得出了结论:简•奥斯丁和沃尔特•司各特是那个年代最有影响力的作家。

体育运动

在特定的运动项目中,谁是历史上最好的球队或球员?这个问题如果交给球迷,那必将吵得不可开交,因为评判标准同样是主观的。有一则论文利用PageRank分析了1968年之后的所有职业网球比赛,它将相同的两个对手之间的比赛结果进行匹配,以“声望得分”为基础构建了一个网络。得出的结论是,在网球界,Jimmy Connors是史上最好的球员。就像Gleich说的,这些排名背后的基本思想是:假设一个粉丝会追随着一只球队或球员,直到他被打败,而后他会继续追随胜利的一方,直到结果出现。这类似于网上冲浪者在网站链接中做出选择。

神经科学

Gleich 在他的论文中写道:“人类的大脑是一个重要的网络,可我们对它的了解少的可怜”。PageRank当然也适用于此。最近,它被用来评估不同大脑区域之间的联结和重要性,以及随着年龄的变化结果会如何改变。

癌症研究

在一篇名为“Google Goes Cancer”的论文里,研究人员开发了一种基于Google算法的“新型计算方法”,该算法帮助他们确定了七个与遗传有关的肿瘤基因,这将帮助医生更好的指导癌症治疗的过程。

交通网络

PageRank的另一应用是用来预测城市里的交通流量和人流动向。有一项研究依赖于该算法的一个关键因素:一个叫做teleporting(传送)的概念,它模拟了人类的决定:开始或中止行程,或者在既定的街道停车。这有助于交通运输研究人员更好的创建测量模型,模拟道路的车流量和人流量。

时间: 2024-09-20 00:14:48

Google的PageRank算法无所不能?的相关文章

深入浅出PageRank算法

PageRank算法 PageRank算法是谷歌曾经独步天下的"倚天剑",该算法由Larry Page和http://www.aliyun.com/zixun/aggregation/16959.html">Sergey Brin在斯坦福大学读研时发明的,论文点击下载: The PageRank Citation Ranking: Bringing Order to the Web. 本文首先通过一些参考文献引出问题,然后给出了PageRank的几种实现算法,最后将其推

Google揭密PageRank技术

编者按:透过位于山景城的一家搜索引擎公司的一份专利申请书,可以中让我们对这个搜索引擎的PageRank技术内幕多一些了解. 域名注册时限 作为一个合法的网站拥有者来说,无不希望自己的域名注册至少已有一年的历史.这是由于,对于Google的PageRank算法来说,如果网站注册时间不超过一年,那么Google可能不会给该域名分配应得的PR值,而是要低一些. 那些网站作弊的家伙总是企图将域名注册时间降至最低,也就是一年,但据Google的专利申请文件显示,这其实是一种非常糟糕的做法.在Google专

从赌钱游戏看PageRank算法

谈到并行计算应用,会有人想到PageRank算法,我们有成千上万的网页分析链接关系确定排名先后,借助并行计算完成 是一个很好的场景.长期以来,Google的创始发明PageRank算法吸引了很多人学习研究,据说当年Google创始者兴奋的找到 Yahoo!公司,说他们找到一种更好的搜索引擎算法,但是被Yahoo!公司技术人员泼了冷水,说他们关心的不是更好的技术, 而是搜索的盈利.后来Google包装成了"更先进技术的新一代搜索引擎"的身份,逐渐取代了市场,并实现了盈利. 由于PageR

【原创】机器学习之PageRank算法应用与C#实现(1)算法介绍

考虑到知识的复杂性,连续性,将本算法及应用分为3篇文章,请关注,将在本月逐步发表. 1.机器学习之PageRank算法应用与C#实现(1)算法介绍 2.机器学习之PageRank算法应用与C#实现(2)球队排名应用与C#代码 3.机器学习之PageRank算法应用与C#实现(3)球队实力排名应用与C#代码  Pagerank是Google排名运算法则(排名公式)的一部分,是Google用于用来标识网页的等级/重要性的一种方法,是Google用来衡量一个网站的好坏的唯一标准.在揉合了诸如Title

【原创】机器学习之PageRank算法应用与C#实现(2)球队排名应用与C#代码

在上一篇文章:机器学习之PageRank算法应用与C#实现(1)算法介绍 中,对PageRank算法的原理和过程进行了详细的介绍,并通过一个很简单的例子对过程进行了讲解.从上一篇文章可以很快的了解PageRank的基础知识.相比其他一些文献的介绍,上一篇文章的介绍非常简洁明了.说明:本文的主要内容都是来自"赵国,宋建成.Google搜索引擎的数学模型及其应用,西南民族大学学报自然科学版.2010,vol(36),3"这篇学术论文.鉴于文献中本身提供了一个非常简单容易理解和入门的案例,所

《R的极客理想——高级开发篇 A》一一2.2 PageRank算法R语言实现

2.2 PageRank算法R语言实现 问题 如何用R语言实现PageRank算法? 引言 Google搜索,早已成为我每天必用的工具,我无数次惊叹它搜索结果的准确性.同时,我也在做Google的SEO,推广自己的博客.经过几个月尝试,我的博客PR到2了,外链也有几万个.总结下来,还是感叹PageRank的神奇.笔者认为PageRank是改变互联网的算法!2.2.1 PageRank算法介绍 PageRank是Google专有的算法,用于衡量特定网页相对于搜索引擎索引中的其他网页而言的重要程度.

Google排名新算法之二

第二部分: 探索Google PageRank新算法2-1. Google的主题性趋向 2-1-1. 关于页面级别(PageRank)及Google的旧算法出现问题的原因 页面级别(PageRank)计算系统所遵循的思路是:通过一个经由互联网的"随机运动"来告诉你哪些站点是最重要的.该系统模拟的是一个随机冲浪者跟进点击某页面上的随机链接,至最深层页面时按"返回"按钮这一过程.页面的等级越高,则随机网络冲浪者发现它的机率亦越高. 这种思路其实相当富有创意.一个网页的外

PageRank 算法解析

PageRank 算法解析    Jun 26, 2005 来源:未详         什么是PageRank? PageRank是Google衡量网页重要性的工具,测量值范围为从1至10分别表示某网页的重要性.在Google工具栏可以随时获得某网页的PageRank值.在这里我们将PageRank的一些特殊之处,从而对其能够获得较为深入的了解,使广大用户能够更好的使用和了解Googel. 网站 排名的历史渊源 上世纪90年代早期网络刚刚兴起之时,每天都有大量的含有特别行业内容的站点发布于网上.

做英文网站优化你必须懂pagerank算法

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 我们都知道百度在中国占有很大的市场,今年三月,百度在中国的占有率已高达81.51%其次就是谷歌.这是从中国范围内来说的,但是从世界范围内来看,搜索引擎界的霸主还依旧是谷歌.上述可知,要是你要做中文网站的优化,那百度是你必须拿下的地方.而你要想做英文网站的优化,那谷歌你不可不攻略. 说到谷歌的优化,那我们就必须知道pagerank算法.也许这对