石榴算法猜想——百度如何判断网页质量

  石榴算法—低质量页面终结者:2013年5月17日下午,百度网页搜索反作弊团队在百度站长平台发布公告称:将于一星期后正式推出新的算法“石榴算法”。新算法前期将重点整顿含有大量妨碍用户正常浏览的恶劣广告的页面

  那么,“石榴算法”中,百度究竟是如何判断网页质量呢?网上较多文章对此发表观点,归纳有以下几点:

  感兴趣的受众群大小

  该页面的稀缺程度(可替代性)

  该页面是否有弹窗

  该页面广告的多少

  由上可见,目前我们的研究重点大部分集中在对网页的页面价值的判断上,缺乏对搜索用户交互行为的研究与分析。

  今天,我们尝试从搜索用户交互行为的角度出发,猜测百度如何判断文章质量。

  对于安装了百度统计的用户,百度可以根据跳出率、退出率、页面停留时间几个关键指标,很容易对网页质量加以判断。

  然而,对大部分没有安装百度统计的搜索用户,百度是不可能跟踪这些关键指标的,百度通过迂回战术从侧面分析关键词的匹配度,匹配度越高,表明文章质量度越高。

  百度如何通过搜索行为判断文章质量?我以为,主要根据以下2点:

  一、通过对搜索结果的二次点击率(或多次)进行判断

  二次点击率是指:当用户点击某结果后,(因不满意结果)产生第二次点击(或多次)的比率

  如果某页面二次点击率非常低,百度搜索引擎有理由相信,此网页的关键词匹配度非常高,同时文章的质量也有保证。因为,众多用户的行为已经为网页投了关键的一票。

  二次点击率是相对上一条点击而言。百度搜索默认显示10条搜索结果,我们假设一个这样的情景:大量用户点击到第6条结果,就不再点击其他结果,从常理来说,第6条结果的网页,是最匹配的,那么质量度自然较高。如果这种数据表现达到一定程度,百度很可能会把它的排序提高到前面几位(提高排序权重)。

  二、通过两次点击之前花费的间隔时间进行判断

  假设百度搜索某个关键词,并按分别顺序点击了A/B/C 3个结果。如下图:


  根据普通用户习惯,他会先打开并查看A网页,可能结果不满意或信息量不足够,他又回到百度搜索界面,点击了B网页,阅读完B网页后,他又打开C网页。

  我们可以看到,A->B 时间间隔, B->C 时间间隔 是百度可以获取的信息。 通过海量用户的间隔时间的横向比较分析,百度足够建立这样一个关键指标。

  假设大量数据显示,A->B 时间间隔为30秒,B->C 时间间隔为 50秒,那么搜索引擎认为,B的质量高于A。 这就是间隔时间判断的一个重要逻辑。

  以上是我们对“百度如何判断网页质量”猜测的一些逻辑与思路,实际上百度搜索的算法模型肯定更复杂庞大。尤其现在百度产品已经涉及方方面面,百度统计、百度分享还有最近的百度浏览器,相信百度会把这几方面的数据综合利用起来,能够更精准的分析判断网页质量。本文原创:新华书店 http://www.gg1994.com 转载请注明出处!

时间: 2024-10-12 07:11:59

石榴算法猜想——百度如何判断网页质量的相关文章

石榴算法:百度抓住了提高网站用户体验度本质

百度推出<石榴算法-低质量页面终结者>文章,意在真正的维护用户体验的措施.当今信息时代,作为互联网用户,上网查看和浏览信息已成为大多数网络用户的生活方式.然而,当用户打开电脑上网的时候,经常会遇到网页上的广告满天飞,甚至部分网页会弹出大量低质.混淆页面主体内容的垃圾广告和掩盖网页主体内容的大面积广告.显然,这样的广告严重的影响了用户体验. 现在,石榴算法正是惩罚因影响用户体验度的网站,真正抓住了提高网站用户体验度的本质内容. 不可否认,广告是若干网站运营的收入来源之一.在优质网站上合理放置广告

百度策略对网页质量的压迫,命运堪忧的B2B该何去何从

中介交易 SEO诊断 淘宝客 云主机 技术大厅 五月将尽,在这个充满黑暗的五月份,百度发布了<百度网页搜索质量白皮书>,虽然白皮书还只是大纲,但已经让很多站长的小心脏承受不住,而且有不少站长因网站索引量大跌和网站权重被降而处于精神崩溃的边缘,尤其是B2B行业站的站长,在这个黑暗的五月份里可谓是经历了一场大风大浪. 为什么说在这个五月是黑暗的月份呢?主要是因为百度发布了有关于网页搜索质量的白皮书,而白皮书主要针对网页的质量,鼓励高质量的网页.打击低质量的网页,让质量低的.对用户没有体验的网页内容

百度新算法怎样判断高质量外链和原创内容

百度搜索引擎为了提高互联网的良性发展,对搜索算法的更新也是日新月异,短时间内推出两大搜索新算法,要求网站运营需要符合用户体验,给用户提供有价值的内容,新算法给站长们带来的影响是很大的,百度搜索引擎判断高质量外链和原创内容的标准是怎样的?哪些因素能影响到蜘蛛的判断? 判断外链是否用户真心推荐 百度判断一个外链是否为问题外链的唯一原则:是否是用户或者其他网站的真心推荐,是否具体高质量的推荐意义.蜘蛛又是如何判断外链是用户推荐还是网站运营推广者,蜘蛛会根据用户搜索的关键词.URL.IP地址.浏览器的类

百度石榴算法逆袭谈SEO公司应对策略

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 百度石榴算法即将来袭,作为SEO公司的一名主管,你必须保持警觉,认真分析下当下的SEO策略,看看哪些地方需要整改,以及公司内部的SEO团队该如何调整等.百度算法千变万化,但不会改变最基础的东西,SEO公司大部分都在接企业站优化订单,企业站优化看似简单,可如今操作起来难度却不小,先不说订单不好接,单凭从优化的角度来说也会碰到棘手的问题.之前的百

百度如何判断原创

摘要: 在上篇百度鼓励原创中,Q猪引用了百度站长平台关于如何判断原创的一段话,今天Q猪想就这段话,谈谈判断原创的几种方式,欢迎拍砖. 站长平台关于百度如何判断原创的描述是这样 在上篇百度鼓励原创中,Q猪引用了百度站长平台关于如何判断原创的一段话,今天Q猪想就这段话,谈谈判断原创的几种方式,欢迎拍砖. 站长平台关于百度如何判断原创的描述是这样的: 首先,通过内容相似程度来聚合采集和原创,将相似网页聚合在一起作为原创识别的候选集合; 其次,对原创候选集合,通过作者.发布时间.链接指向.用户评论.作者

基于百度白皮书的网页优化需遵循的三个原则

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 面对着垃圾泛滥的互联网内容,作为在互联网中拾宝的百度,显然希望互联网上能够到处充斥各种各样的宝贝,而不是现在随处可见的垃圾内容,在这个背景下,百度提出了网页质量的优化白皮书,并提出了重要的原则,那就是网页内容质量和用户浏览体验以及可访问性.那么如何解读这三个原则,并以此搞好网站的优化呢? 首先谈谈网页内容质量原则.内容是网页的主体,也是网页质

石榴算法下的你和我,该何处何从?

2013年百度开始更新了算法,那就是绿萝卜算法,而现在百度又一次出炉了石榴算法.对于即将上线的石榴算法,站长之间引起了轩然大波,那究竟什么是石榴算法呢?百度针对网站又有了什么新的举措呢? 有资深的站长已经在各大论坛里面探讨过这次算法的具体内容.石榴算法主要是针对这个方面,前期将重点整顿含有大量妨碍用户浏览的恶劣广告的页面,这方面站长要注意,网站千万不能被黑.每天及时抽空查看网站数据,查看是否出现问题,如果有问题的话,需要站长及时处理好.尤其是那些弹出大量低质弹窗广告.混淆页面主体内容的垃圾广告页

浅析百度分享对网页排名的影响

  自从百度在一年前推出百度分享这社会化按钮之后,越来越多的站长在自己网站上都添加了这一小工具.一方面是因为百度分享按钮能够发挥功能,把网站分享出去,更重要方面是认为安装百度分享能够提高网站的权重,所以百度这一小工具就迅速传播开来. 那网站安装百度分享后是否能增加网站的权重呢?笔者认为是肯定的.百度对自家产品都赋予一定的权重,百度分享也不例外,使用了百度分享的网页被用户分享后,可以使该网页被分享的次数展示在百度的搜索结果页中,辅助用户判断网页质量,所以百度分享是能提高网站的权重的. 但是百度分享

百度又推出了针对优化页面的石榴算法

摘要: 广告,是大多数网站生存的方式之一,甚至是一部份网站的全部收入来源.可以说,没有广告,不会有大批中小个人网站的产生,没有广告,不会有国内互联网的繁荣昌盛.但是从网站 广告,是大多数网站生存的方式之一,甚至是一部份网站的全部收入来源.可以说,没有广告,不会有大批中小个人网站的产生,没有广告,不会有国内互联网的繁荣昌盛.但是从网站的根本功能来说,当然是为用户提供相关内容信息,而不是提供广告推荐.搜索引擎角度来考虑,他们希望用户最直接的找到自己想要的信息,如果一个网站广告满天飞,用户很难找到有用