“HillTop”论 - 探索Google排名新算法(一)

    编者按:2003的11月16号--这个日子可能会成为搜索引擎 历史的一个重要里程碑。正是在这次被大家称为“ Google Florida“的更新中,Google对其排名算法进行了大规模改动,并导致很多原来排名很好的网站在一夜之间如梦魇般直落孙山。每个更新周期可能会对排名算法做一些小小的改动Google一贯的做法,但这次如此大手笔的改动,不能不让网站管理员乃至整个搜索引擎 优化行业都倍感震惊和始料不及。不但很多原来排名一直保持前矛的商业网站丢掉了排名,同时亦使得许多做网站排名优化的公司都受到了不小的冲击。但由于Google几乎占据了搜索市场的大半江山,倘若此时弃而转用其它搜索引擎 进行生意推广,并不见得为明智之举。
 
    对于Google新算法到底采用了什么新机制,仍然是SEO界争论的焦点。目前有两种主要理论。一种是“专家系统“,即Hilltop算法,也就是本文将要阐述的;另外一种则是以Dan Thiesw为首的 TSPR(Topic-Sensitive-PageRank:主题性页面级别技术)理论,其大概思路为:查询发生时,Google将对查询条件和CIRCA数据库中包含的主题进行匹配,查询与主题的关系越密切,则主题性页面级别得分效果越佳。此外,由于一个给定的查询条件可能会与数据库中多个主题匹配,所以页面级别计算中出现的任何小错误都将由关联的一定数量的主题性页面级别得分平摊,因而近似的主题性页面级别得分即可提供高质量的搜索结果。详细论述可参看“TSPR理论-如何应对Google PageRank排名新算法“。我们相信,无论Google采用什么新算法,其目的均旨在向用户提供更为精准的搜索结果。
 
    HillTop (LocalScore) 算法
    作者:Atul Gupta
    Google新算法的庐山真面目到底是什么?这仍然是个迷。而在Google网站上,从其“对高质量内容网站进行奖励及对采用恶意技术的网站进行惩戒“内容中,亦无什么新内容可寻端倪。自然,作为搜索引擎 ,这种做法是完全可以理解的。搜索引擎 的算法应该是保密的,因为它们对新算法的任何评论,同意或否定的言行都会泄露其新算法,而任何对排名系统的一丁点泄漏都有可能被一些人钻了空子,并用来恶意操纵搜索结果,从而破坏搜索结果的客观公正性。
 
    我们根据一些比较具有可行性的推测,并结合实际研究、试验,以及对搜索引擎 行为的发展趋势和历史的知识基础,得出了一些发现。首先,我们来看看对于Google新算法的一些比较值得注目的发现:

时间: 2024-09-11 21:03:05

“HillTop”论 - 探索Google排名新算法(一)的相关文章

“HillTop”论 - 探索Google排名新算法(1)

     2003的11月16号--这个日子可能会成为搜索引擎历史的一个重要里程碑.正是在这次被大家称为" Google Florida"的更新中,Google对其排名算法进行了大规模改动,并导致很多原来排名很好的网站在一夜之间如梦魇般直落孙山.每个更新周期可能会对排名算法做一些小小的改动Google一贯的做法,但这次如此大手笔的改动,不能不让网站管理员乃至整个搜索引擎优化行业都倍感震惊和始料不及.不但很多原来排名一直保持前矛的商业网站丢掉了排名,同时亦使得许多做网站排名优化的公司都受

“HillTop”论 - 探索Google排名新算法(二)

    此外,若两个站点均为相同IP地址下的宿主,则认为其中一个是另外一个站点的成员站点.(即:若ww.abc.comwww.ibm.com均为相同IP地址下的宿主,则认www.abc.com是www.ibm.co.uk的成员站点)     Hilltop算法的一个极其重要的特征在于:若没有找到搜索引擎 认为数量足够的"专家文件"(要求至少需有两票),则该算法失效,即返回结果为零.换言之,对于高度明确化的查询条件(查询词语),Hilltop算法的结果很可能为"0".

“HillTop”论 - 探索Google排名新算法

     Hilltop算法是否以实时方式运行     Google所拥有的服务器体系架构就是网络上分布的一万台奔腾级服务器.而一旦了解了Hilltop算法后,我们很难相信这样的奔腾服务器能够具备如此的处理能力:试想一下,首先要从成千上万的主题性文件中找到"专家文件",然后计算目标网页自这些专家文件的链接的得分,然后再将数值返回Google算法的其它排名系统,并做进一步处理-而所有这些要在大约0.07秒内--这个让Google举世闻名的搜索速度内完成.确实使人难以置信.     Hil

“HillTop”论 - 探索Google排名新算法(3)

3.对Hilltop算法的分析和推测3.1 为什么采用新算法     大多数网迷们都知道,页面等级算法是由Google的创始人Sergey Brin和Larry Page所倡起的,用以精良网站在搜索结果中的排名.这也是自1998年Google发布以来的取得种种骄人成绩的重要因素之一.      但页面等级系统亦存在着一个基本的缺陷,Google也深知这一点.它根据一个网页上被链接的站点数量和质量来给该网页分配一个绝对的"重要性值".同时亦将链接页面的页面等级考虑在内.指向一个网页的外部

“HillTop”论 - 探索Google排名新算法(2)

1.2 Google此举动机何在?     如果这是真的,那么Google为什么要这样做?这种推测的后盾在于Google算法更新的时间正好在圣诞购物季节之前,并适逢其IPO上市之际.分析家认为:Google这样做是为了向商业性站点施加压力,如果这些商业网站期盼在一年一度的美国传统的圣诞购物季节得到丰厚赢利的话,就得花钱做AdWords自助广告.免费午餐看来是没有了.还有一些人则认为Google此举旨在为其最终业绩(即基线)涂抹上一点光明的色彩来打动其未来投资者.1.3 那么又是谁取代了商业站点原

“HillTop”论 - 探索Google排名新算法(三)

编后按:HillTop(行业得分) VS TSPR(主题性页面级别) screen.width-380)this.width=screen.width-380" border=0> screen.width-380)this.width=screen.width-380" border=0>

Google排名新算法之二

第二部分: 探索Google PageRank新算法2-1. Google的主题性趋向 2-1-1. 关于页面级别(PageRank)及Google的旧算法出现问题的原因 页面级别(PageRank)计算系统所遵循的思路是:通过一个经由互联网的"随机运动"来告诉你哪些站点是最重要的.该系统模拟的是一个随机冲浪者跟进点击某页面上的随机链接,至最深层页面时按"返回"按钮这一过程.页面的等级越高,则随机网络冲浪者发现它的机率亦越高. 这种思路其实相当富有创意.一个网页的外

Google排名新算法之三

第三部分: 如何在Google新算法中拔得头筹 如何应对Google的新算法?大家可以根据下面所列的一些要点采取相应的措施. 3-1. 关键词的研究:扩大覆盖面搜索引擎策略的中心思想是确定恰当的关键词来锁定目标群体.但有很多网站管理员却在这一步上掉以轻心,只在屈指可数的几个平平常常的关键词身上铆足了劲,却不知这种策略失之偏颇.关键词研究的主要目标应该是确定目标群体所有可能使用的关键词,其中包括了品牌名称.地理位置及修饰语等"修饰成分". 尽管对网站的每个页面只能围绕两到三个关键词进行关

Google排名新算法

第一部分: 最新消息! Google的主要变化 Google的主要变化始于2003年11月的16号,从那时候起,网上论坛就开始对此议论纷纷并产生了形形色色的推测.这种更新对一些人是坏消息,而对另外一些人却是好消息(不过大多数猜测都来自于那些认为这是坏消息的人).Google对其变化只字不提,当然我们也别指望它会说点什么.因此,这篇文章代表了我个人的部分推测,希望它至少为读者您提供了一些"较为可靠的推测". 除了在对搜索结果的排名方式上有一些显著变化外,Google在搜索结果的格式上亦有