基于用户投票的排名算法（三）：Stack Overflow

上一篇文章，我介绍了Reddit的排名算法。

它的特点是，用户可以投赞成票，也可以投反对票。也就是说，除了时间因素以外，只要考虑两个变量就够了。

但是，还有一些特定用途的网站，必须考虑更多的因素。世界排名第一的程序员问答社区Stack Overflow，就是这样一个网站。

你在上面提出各种关于编程的问题，等待别人回答。访问者可以对你的问题进行投票（赞成票或反对票），表示这个问题是不是有价值。

一旦有人回答了你的问题，其他人也可以对这个回答投票（赞成票或反对票）。

排名算法的作用是，找出某段时间内的热点问题，即哪些问题最被关注、得到了最多的讨论。

在Stack Overflow的页面上，每个问题前面有三个数字，分别表示问题的得分、回答的数目和该问题的浏览次数。以这些变量为基础，就可以设计算法了。

创始人之一的Jeff Atwood，曾经在几年前，公布过排名得分的计算公式。

写成php代码，就是下面这样：

各个算法变量的含义如下：

（1）Qviews（问题的浏览次数）

某个问题的浏览次数越多，就代表越受关注，得分也就越高。这里使用了以10为底的对数，用意是当访问量越来越大，它对得分的影响将不断变小。

（2）Qscore（问题得分）和Qanswers（回答的数量）

首先，Qscore（问题得分）= 赞成票-反对票。如果某个问题越受到好评，排名自然应该越靠前。

Qanswers表示回答的数量，代表有多少人参与这个问题。这个值越大，得分将成倍放大。这里需要注意的是，如果无人回答，Qanswers就等于0，这时Qscore再高也没用，意味着再好的问题，也必须有人回答，否则进不了热点问题排行榜。

（3）Ascores（回答得分）

一般来说，"回答"比"问题"更有意义。这一项的得分越高，就代表回答的质量越高。

但是我感觉，简单加总的设计还不够全面。这里有两个问题。首先，一个正确的回答胜过一百个无用的回答，但是，简单加总会导致，1个得分为100的回答与100个得分为1的回答，总得分相同。其次，由于得分会出现负值，因此那些特别差的回答，会拉低正确回答的得分。

（4）Qage（距离问题发表的时间）和Qupdated（距离最后一个回答的时间）

Qage和Qupdated的单位都是秒。如果一个问题的存在时间越久，或者距离上一次回答的时间越久，Qage和Qupdated的值就相应增大。

也就是说，随着时间流逝，这两个值都会越变越大，导致分母增大，因此总得分会越来越小。

（５）总结

Stack Overflow热点问题的排名，与参与度（Qviews和Qanswers）和质量（Qscore和Ascores）成正比，与时间（Qage和Qupdated）成反比。

（完）

时间： 2025-01-02 05:22:06

基于用户投票的排名算法（三）：Stack Overflow的相关文章

基于用户投票的排名算法（一）：Delicious和Hacker News

互联网的出现,意味着"信息大爆炸". 用户担心的,不再是信息太少,而是信息太多.如何从大量信息之中,快速有效地找出最重要的内容,成了互联网的一大核心问题. 各种各样的排名算法,是目前过滤信息的主要手段之一.对信息进行排名,意味着将信息按照重要性依次排列,并且及时进行更新.排列的依据,可以基于信息本身的特征,也可以基于用户的投票,即让用户决定,什么样的信息可以排在第一位. 下面,我将整理和分析一些基于用户投票的排名算法,打算分成六个部分连载,今天是第一篇. 一.Delicious 最直觉

基于用户投票的排名算法（一）Delicious和Hacker News

基于用户投票的排名算法（三）Stack Overflow

上一篇文章,我介绍了Reddit的排名算法. 它的特点是,用户可以投赞成票,也可以投反对票.也就是说,除了时间因素以外,只要考虑两个变量就够了. 但是,还有一些特定用途的网站,必须考虑更多的因素.世界排名第一的程序员问答社区Stack Overflow,就是这样一个网站. 你在上面提出各种关于编程的问题,等待别人回答.访问者可以对你的问题进行投票(赞成票或反对票),表示这个问题是不是有价值. 一旦有人回答了你的问题,其他人也可以对这个回答投票(赞成票或反对票).

基于用户投票的排名算法（四）牛顿冷却定律

这个系列的前三篇,介绍了Hacker News,Reddit和Stack Overflow的排名算法. 今天,讨论一个更一般的数学模型. 这个系列的每篇文章,都是可以分开读的.但是,为了保证所有人都在同一页上,我再说一下,到目前为止,我们用不同方法,企图解决的都是同一个问题:根据用户的投票,决定最近一段时间内的"热文排名". 你可能会觉得,这是一个全新的课题,伴随着互联网而产生,需要全新的方法来解决.但是,实际上不是.我们可以把"热文排名"想象成一个"自然

基于用户投票的排名算法（五）威尔逊区间

迄今为止,这个系列都在讨论,如何给出"某个时段"的排名,比如"过去24小时最热门的文章". 但是,很多场合需要的是"所有时段"的排名,比如"最受用户好评的产品". 这时,时间因素就不需要考虑了.这个系列的最后两篇,就研究不考虑时间因素的情况下,如何给出排名. 一种常见的错误算法是: 得分 = 赞成票 - 反对票假定有两个项目,项目A是60张赞成票,40张反对票,项目B是550张赞成票,450张反对票.请问,谁应该排在前面?按

基于用户投票的排名算法（五）：威尔逊区间

基于用户投票的排名算法（二）：Reddit

(不好意思,这个系列中断了近两周,我会尽快在这几天,把后面几篇写完.) 上一次,我介绍了Hacker News的排名算法.它的特点是用户只能投赞成票,但是很多网站还允许用户投反对票.就是说,除了好评以外,你还可以给某篇文章差评. Reddit是美国最大的网上社区,它的每个帖子前面都有向上和向下的箭头,分别表示"赞成"和"反对".用户点击进行投票,Reddit根据投票结果,计算出最新的"热点文章排行榜". 怎样才能将赞成票和反对票结合起来,计算出一

基于用户投票的排名算法（二）Reddit

上一次,我介绍了Hacker News的排名算法.它的特点是用户只能投赞成票,但是很多网站还允许用户投反对票.就是说,除了好评以外,你还可以给某篇文章差评. Reddit是美国最大的网上社区,它的每个帖子前面都有向上和向下的箭头,分别表示"赞成"和"反对".用户点击进行投票,Reddit根据投票结果,计算出最新的"热点文章排行榜". 怎样才能将赞成票和反对票结合起来,计算出一段时间内最受欢迎的文章呢?如果文章A有100张赞成票.5张反对票,文章B

基于用户投票的排名算法（六）：贝叶斯平均

(这个系列实在拖得太久,今天是最后一篇.) 上一篇介绍了"威尔逊区间",它解决了投票人数过少.导致结果不可信的问题. 举例来说,如果只有2个人投票,"威尔逊区间"的下限值会将赞成票的比例大幅拉低.这样做固然保证了排名的可信性,但也带来了另一个问题:排行榜前列总是那些票数最多的项目,新项目或者冷门的项目,很难有出头机会,排名可能会长期靠后. 以IMDB为例,它是世界最大的电影数据库,观众可以对每部电影投票,最低为1分,最高为10分. 系统根据投票结果,计算出每部电影的

猜你喜欢

设计探讨:做出好的互联网产品

如何做出好产品,这是一个很大的话题,大到我从来都不敢触及.但是当我们结束TOP开发者聚会,翻看很多开发者的会议感想的时候,出乎我意料的是,这些开发者会认真的记下我们给出的建议,很认真,很细致.昨天通过 ...

PS打造令人赞叹的音乐墙纸

属于合成教程用的物件比较多只要大家细心跟着做我想这个教程其实并不难大家也可以开拓思路设计一个属于自己的墙纸. 属于合成教程用的物件比较多只要大家细心跟着做我想这个教程其实并不难大 ...

C语言链表的创建与排序

include<stdio.h> #include<stdlib.h> typedef struct STRUCT { int value; struct STRUCT *ne ...

用Web Service传送文件（一）

开篇去年,第一次编写 Web Service 的时候,我就有个疑问:这玩艺儿能不能传送文件! 在实际开发中传写文件是经常性的需求,Visual FoxPro 程序员要在 Internet 上做这件事 ...

简易C#的IDE

五一时去朋友那, 他问了个小问题, 只要写几十行代码就可以很好的说明问题.可偏偏机子没装VS, 只好做罢.回来后想想, 要是有个在线的C#IDE就好了.于是上网查了下相关的资料, 整出来个简单的在线C ...

使用“限制编辑”对Word文档进行保护设置的操作方法

使用"限制编辑"对Word文档进行保护设置的操作方法一.快捷步骤文件 → 信息 → 保护文档 → 限制编辑 → 勾选"限制对选定的样式设置格式&qu ...

淘宝千牛商品管理软件怎么设置自动上下架商品

先登录千牛工作台,看到右侧的商品管理了吗,打开这个插件,一开始可能需要授权,你授权一下就好了. 点击自动调整按钮,打开自动上下架的对话框(以前这里就叫做自动上下架,下载改名为自动调整.) 我们看到 ...

YoMail邮件统计功能怎么使用

格子啦小编觉得,工作都是繁忙的,日子过的像流沙,徐徐的流走,工作书写总结难免冥思苦想YoMail的邮件统计功能,可以帮我们自动记录同事.客户.亲友间的邮件往来数目,点击名称还能跳转邮件对话,往来邮件清 ...

android-如何为一个 linear layout 在 xml 中设置 gradient？

问题描述如何为一个 linear layout 在 xml 中设置 gradient? 如何为一个 linear layout在 xml 中设置 gradient.我想给布局中的使用圆边角设置视图的 ...

jpg-文件搜索所有磁盘下面的图片

问题描述文件搜索所有磁盘下面的图片 1.文件搜索,搜索所有磁盘下的jpg/png/gif等格式的图片需要用到String类中的endswith 2.将搜索到的东西放到集合中 3.将集合中的数据按照 ...

jaxbcontext-java用注解实现将xml中的值获取到并在控制台打印为什么出错

问题描述 java用注解实现将xml中的值获取到并在控制台打印为什么出错 <?xml version=""1.0"" encoding="&qu ...

cmake使用方法详解

cmake 简介 CMake是一个跨平台的安装(编译)工具,可以用简单的语句来描述所有平台的安装(编译过程).他能够输出各种各样的makefile或者project文件,能测试编译器所支持的C ...

【浅谈JavaEE框架】Spring中@Autowired标签与@Resource标签的区别

@Autowired Spring 2.5 引入了 @Autowired 注释,它可以对类成员变量.方法及构造函数进行标注,完成自动装配的工作. 通过 @Autowired的使用来消除 set , ...

一分钟了解阿里云产品：从域名到网站，只需四步

从域名到网站,只需四步,轻松访问第一步. 注册域名. 首先您需要先拥有一个域名,没有域名先购买域名,这是一个很简单的事情. 第二步. 准备服务器和网站. 1.我已经有域名 ...

layer弹出层里的div悬浮在上面显示，超出layer的高度时不要隐藏，怎么实现？？

问题描述 layer弹出层里的div悬浮在上面显示,超出layer的高度时不要隐藏,怎么实现?? layer弹出层里的div悬浮在上面显示,超出layer的高度时不要隐藏,怎么实现?? 或者layer ...

Linux块设备驱动之NOR FLASH

块设备驱动之NOR FLASH和NAND基本没有区别,具体两者功能上区别,做嵌入式开发的朋友们就一定要理解过来,这里牵扯到很多地址的问题,超出本文的范围,有机会我会把整个项目从硬件到应用程序的流程写出 ...

看日本、香港和鱼群如何应对群体性恐慌

日本警察用什么手段防止踩踏悲剧新年第一天起来看新闻,第一条便是"上海外滩发生踩踏事件,35人死亡."怎么都难以相信会发生这样的事,当父母一早醒来听到孩子没了,这是多大的悲剧! 我 ...

爆料：曹旭东创立自动驾驶公司Momenta 首次公开项目细节

之前一直盛传曹旭东从商汤科技离职创业的消息,今天这个消息正式坐实.曹旭东向雷锋网表示,其离职创业的项目叫做Momenta,团队核心成员包括曹旭东(CEO),孙刚(研发总监),任少卿(研发总监),夏炎( ...

Netscape 创始人Marc Andreessen 设立风险基金

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅全球金融危机让风险投资出现低迷势态 ...

Cg编程自学心得

在计算机图形学领域,用计算机处理图形信息我们最先接触的通常是使用opengl和d3d这些图形编程接口,这些通常称为固定管线的编程,也就是程序员不直接操纵可编程的GPU,在常见的opengl的编程管线 ...

Swift实战-豆瓣电台（六）视图跳转，传参及回跳

原文:Swift实战-豆瓣电台(六)视图跳转,传参及回跳 youku观看地址:http://v.youku.com/v_show/id_XNzMxMzQ3MDcy.html 要点在ChannelCo ...

解决Visual Studio 2012 Update 4 RC启动调试失败的方案_实用技巧

本教程就是帮助大家解决Visual Studio 2012 Update 4 RC启动调试失败的问题,具体内容如下以下解决办法适用于任何Visual Studio开发环境,及Windows NT 6 ...

使用ThinkPHP+Uploadify实现图片上传功能_php实例

首先,将下载的Uploadify压缩包解压放到公共文件夹内.实现代码如下: 前台html部分: <script src="/uploadify/jquery.min.js" ...

Call to undefined method DebugBar\\DebugBar::info()

使用 Laravel 的调试工具 laravel-debugbar 的 Facade 方式 Debugbar::info(), Debugbar::error()等方法打印日志消息,页面打不开,查看 ...

腾讯微博衰落之谜：耀眼光环下的阴影笼罩

3月21日,腾讯开通了自己的新浪微博帐号.看似是一个简单的行为,却是一个信号,预示着腾讯微博的衰落,从小即生活在QQ光环下的阴影中,后来更是被微信的阴影笼罩,腾讯微博的衰落已经注定. 原因之一,腾讯整 ...

爱奇艺推出“网络院线”发行模式“分甘同味”电影计划

受到好莱坞电影.商业大片冲击及传统院线排片限制,很多新导演的小成本电影基本无缘与观众见面,2012年,国内全年生产故事片745部(含电影频道出品的数字电影92部),其中能上院线的仅不到三分之一.与此同 ...

Linux 内核里的数据结构——基数树

Linux 内核里的数据结构--基数树正如你所知道的,Linux内核提供了许多不同的库和函数,它们实现了不同的数据结构和算法.在这部分,我们将研究其中一种数据结构--基数树Radix tree.在 ...

用Grub启动ISO镜像

用Grub启动ISO镜像如果你想要使用多个Linux发行版,你没有那么多的选择.你要么安装到你的物理机或虚拟机中,要么以live模式从ISO文件启动.第二个选择,对硬盘空间需求较小,只是有点麻烦,因 ...

jQuery UI v1.8.9发布一套jQuery的页面UI插件

jQuery UI 1.8 的第九个维护版本,主要bug修复包括:Accordion, Datepicker, Draggable, Sortable and Tabs. jQuery UI 是一套 ...

微软展示IE性能实验室 120种各式机器

微软今天在官方博客发表文章表示,公司已经建立了http://www.aliyun.com/zixun/aggregation/33885.html">IE浏览器性能实验室,他们收集了市 ...

热搜