基于用户浏览记录的网页rank思路

  


 

  Google的pagerank就不多介绍了,一个能衡量网页重要程度的算法,本质上是网页相互投票的结果,基于这个特性,我们可以通过使用sitemap让搜索引擎尽可能浏览到多的网站内容,也可以通过多做外链来提高网站的PR值,达到SEO的目的。

  市场上大多数搜索引擎都在使用pagerank类似的方法,且为了保证公正性,都采用纯机器运行的方式,通过网页爬虫来遍历网站,这就出现了一些有趣的问题:

  1、一个网页的内容是很棒的,但是由于外链太少,爬虫在设定的深度阈值下可能无法爬到它,成为了少人问津的“暗内容”

  2、部分网站因为PR值很高,即使转载的内容或是价值不高的内容,也可能有很好的检索排名,即使技术领先的搜索引擎采用语义网络的方法识别优质内容,效果依然不够好

  为了规避以上问题,引入用户数据来评判网页内容的重要性及质量,是一个可研究方向,怎么做呢?

  假设: 浏览行为及时长是对网页质量的最好评判,相当于用户标注,在大规模数据的情况下,效果应优于机器

  原理:

  1、通过浏览器或其他客户端软件,最好的防火墙或其他安全软件,获取用户浏览日志,上传给搜索引擎的爬虫数据库,即是得到用户浏览数据

  2、爬虫匹配已有索引库,找到未索引内容,爬之

  3、利用用户日志给网页投票,浏览时间越长权重越高,计算出网页的rank

  缺陷:

  1、依赖客户端

  2、有用户隐私问题

  规避:

  1、提出云杀毒、云防御、云安全,让用户同意上传浏览记录

  2、偷偷上传,将浏览记录(其他文件也可以)加密并分拆上传,在服务器端组合还原

  好了,思路说完了,来给它起个响亮高深名字:peoplerank

  最后,我这是很严肃地说技术

  Via i黑马 By sluke陆蔚青 原文地址:http://luplusplus.com/peoplerank-modle

时间: 2025-01-21 00:32:26

基于用户浏览记录的网页rank思路的相关文章

不得了 美国ISP承诺不卖用户浏览记录

不久前,美国国会正式推翻了FCC网民隐私政策,正式代表用户的网页浏览数据可以被互联网服务提供商出售给第三方.但随后,大量ISP承诺不会卖用户的浏览记录. 在决定放出后,美国各方隐私倡导者和机构都相继表达了反对的情绪.而随后,ISV厂商如AT&T.Verizon.Comcast等多家大型互联网服务提供商表态他们不会出售用户的浏览记录. 这其中,Verizon表示的十分坚决,他们承诺绝对不会把客户的个人网页浏览记录数据卖掉,这是底线.Comcast也同样认为,卖掉个人网页浏览数据的行为从未做过,无论

Google拟推网页浏览记录 允许用户自行整理

      4月24日消息,Google公司日前表示,计划推出一项全新服务,帮助用户保存完整的网页浏览记录.      据vnunet报道,此项服务名为"Google网页历史",将允许用户整理.搜索和浏览所有浏览过的网页.图像和视频.另一方面,该服务还将支持整合型网页,并且根据个人设置进行历史纪录搜索."想象一下,你可以随时知道,过去一年中你总共浏览了什么网页,例如YouTube上和朋友一起上传的宝贵录像,或者网络相册中的珍贵图片."Google公司个人化产品经理P

Archify:网页浏览记录云存储 可记录社交更新

北京时间2月6日消息,<移动新发现>今日报道,一家来自奥地利的初创公司正在开发一款名为Archify的浏览器插件,它可以记录用户浏览过的全部网页内容(包括Facebook和Twitter上的更新)并留下截屏存档,从而方便用户日后查找与回顾. Archify已进入封闭测试阶段,预计将于2012年3月下旬正式面世,目前只有收到邀请的人才能试用. 帐户设置:可关闭与社交媒体的连接 用户激活自己的帐户之后,浏览器会自动检测出Archify插件并提示用户安装.它适用于所有主流浏览器,包括Firefox.

知识:CSS方便地控制用户浏览网页时使用的光标

css|光标|控制|网页 CSS允许你控制网页外观和布局的各个方面--包括字体.页边空白和光标.不错,从CSS 2.1开始,你就可以方便地控制用户浏览网页时使用的光标. 标准的CSS光标呈箭头状,一般来说,它都能满足一个网页或网站的需求,但有些时候你可能需要使用其它的光标.在这些情况下,CSS标准提供了众多选项. CSS光标类型 下表概括说明了CSS标准中的一些光标类型. 默认光标:使用标准的箭头. 手状光标:光标呈手形,食指伸出. 指针状光标:与手状光标相同. 十字线光标:使用十字光标(一个加

网页宽度是多少符合用户浏览

网页多宽才合适,这个问题可能并没有一个标准,也没有对错之分,可能我们在使用网页尺寸的时候更多的想的并因该是用多大的宽度,而是我们的访问者更适合多大的网页宽度! 1.结论:固定宽度只适合功能型网站,不适合希望用户认真阅读的浏览型网站.UCD大社区是浏览型网站,它的定位是"知识库",希望你停留在这里认真浏览和阅读. 2.大屏幕不是用来显示更宽文字内容的,大屏幕下必然会面临鼠标长途奔袭的问题.建议用大屏幕的人:为自己的身体健康着想,在大屏幕下阅读的时候,养成缩小窗口的习惯.共勉 :) 3.希

网页设计趋势:撞色风 色彩引导用户浏览页

撞色风(Color Blocking)已经成为网页设计的趋势.运用方形(或矩形甚至弧形)的色彩盒作为色彩工具已经开始普及开来. 这种撞色风的趋势最先在时尚界流行.箱.包.鞋类甚至是运动服类的将多种色彩放在在一起,他们不是形式的搭配,而是单独色彩块的搭配. 现在撞色风格的趋势逐步渗入设计领域. 也许你看见的这种颜色不是你所期望的,这种撞色风的趋势主要集中在明亮色彩上,而非米色,也不是颜色相近的颜色. 因此你总是会看见现在的网页会运用流行的粉色,橘黄色和红色. 但是,撞色风格的网页设计确实不错.流行

具体流程-记录用户的浏览记录并保存到数据库中当用户在次浏览时显示上次

问题描述 记录用户的浏览记录并保存到数据库中当用户在次浏览时显示上次 记录用户的浏览记录并保存到数据库中当用户在次浏览时显示上次浏览相关的内容, 写出具体流程. 求解 ...

代码-求大神指导!!!!!如何实现记录用户浏览数,将浏览的类型记录下来,根据次数形成用户标签来做推广

问题描述 求大神指导!!!!!如何实现记录用户浏览数,将浏览的类型记录下来,根据次数形成用户标签来做推广 我做的是一个o2o的活动网站,线上报名活动,同时线上有论坛 我希望根据用户经常报名的活动类型或者参与的论坛版块记录下这些浏览数, 然后在数据库表里将浏览的主题和次数形成用户的标签,来做相应的活动或产品推广 我的活动表activity里有type就是活动的类型 帖子表tiezi有版块就是帖子的类型 然后要怎么记录用户的浏览数的代码如何实现, 然后是新建一张表里面有userid,浏览次数,标签呢

苹果iCloud新漏洞:删了一年的网页浏览记录照样可以恢复

苹果似乎已经修复了iCloud的一项漏洞,而在此之前,该服务会将通过已经删除的Safari浏览记录保留一年多时间. 本周四,俄罗斯计算机取证软件公司Elcomsoft表示,该公司的取证软件可以恢复在iCloud中存储并且已经删除的历史记录,包括某个网址上一次的访问日期以及删除时间. Elcomsoft CEO弗拉基米尔·卡塔洛夫(Vladimir Katalov)在博客中强调了浏览数据的取证价值.由于iCloud会持续同步信息,所以如果用户开启该功能,便可给监视和调查工作带来很大帮助. 就在El