《中国人工智能学会通讯》——9.27 针对垂直搜索结果的点击模型

9.27 针对垂直搜索结果的点击模型

随着 Web2.0 时代的快速发展,搜索引擎页面正在变得越来越异质化,大量包含富文本信息的搜索结果被引入搜索页面。这些搜索结果来自于搜索引擎的多个具有特定搜索目标的子引擎,通常称为垂直搜索引擎。这些来自垂直搜索引擎的垂直搜索结果(例如图片搜索引擎得到的图片结果)往往与传统的结果具有不同展现形式,因此现今搜索页面上的搜索结果正在变得非常异质化,这也使得用户浏览行为习惯和偏好可能产生比较大的变化。

Wang et al [11] 对一家中文商业搜索引擎的大规模搜索日志进行了分析(详细分析结果请见下一小节),发现当前中文搜索环境下超过 80% 的搜索结果页面包含有垂直结果,并且不同展现形式的垂直结果对用户的行为产生了很大影响,包括对于垂直结果本身(局部影响)和对整个搜索页面(全局影响)。因此,对于现今的搜索引擎来说,考虑不同垂直结果是非常重要的因素。

他们根据中文搜索引擎常见的搜索结果(如图5 所示),结果根据展现形式进行了下述分类。

(1)普通结果:非垂直结果,最常见的搜索结果展现形式,由一条超链接标题和一段文本摘要组成。

(2)文本类垂直结果:由一段文本摘要和多条超链接标题组成,例如新闻类或者百科类搜索结果。

(3)多媒体类垂直结果:主要由一组多媒体组件(通常为一组图片)组成,例如视频、图片类搜索结果。

(4)应用类垂直结果:由嵌入搜索页面的一组组件组成,用户可以通过与组件交互直接得到搜索结果,例如计算汇率兑换的计算器。
FCM 模型

Chen et al [16] 最早提出了针对垂直结果的点击模型,他们分析了部分垂直结果对用户点击的影响,提出了 Federated Click Model (FCM) 模型,该模型假设用户的检验概率可能会受到最近的上一个垂直结果的影响(吸引假设):

P(A = 1) = hpos rvert
P(E i = 1 | A = 0) =ϕ i
P(E i = 1 | A = 1) =ϕ i +(1-ϕ i )β dist

式中 A 表示用户是否被垂直结果所吸引,如果用户被垂直结果吸引 A = 1,那么该用户的检验其他普通结果的概率会收到一定的影响。

VCM 模型
Wang et al [11] 利用眼动追踪设备对用户的搜索浏览行为进行了深入分析,他们发现不同展现类型的垂直结果对用户的视线注视行为有很大影响。如图 6 所示,左侧为不含垂直结果的页面,右侧为包含多媒体垂直结果的页面,热度图越暖色表示用户的视觉注视越多。可以看到,当多媒体垂直结果加入页面后,用户的视线被很大程度吸引,从而不再像左图一样的自上而下的递减分布。


Wang et al [11] 针对用户的浏览行为变化进行了深入的分析,最终总结了 4 个用户行为偏执假设。

(1)吸引力偏执假设:如果有一个垂直结果在搜索结果页面中出现,那么用户有一定的概率首先检验该垂直结果。

(2)全局影响偏执假设:如果有一个垂直结果在搜索结果页面中出现,并且用户首先检验了该垂直结果,那么用户会对整个页面有一个全局印象,该印象会使用户对普通搜索结果的检验和点击偏好产生影响。

(3)首位偏执影响假设:如果有一个垂直结果在搜索结果页面中出现,并且该垂直结果被排在了第 1 位,那么用户就可能会更多地点击该垂直结果而较少点击其他结果。

(4)浏览顺序偏执影响假设:如果有一个垂直结果在搜索结果页面中出现,并且用户首先检验了该垂直结果,那么用户会在接下来回看垂直结果之前的搜索结果,回看的路径或者为回到顶端自上而下浏览,或者为沿着自下而上的顺序反序浏览。相应的点击模型描述为

P(C i =1|E i =0)=0
P(C i =1|E i =1)=P(A i =1|E i =1)
P(F=1)=ϕ t v ,l vP(E i =1|F=0,C 1:i-1 )=γ i,i-l i
P(E i =1|F=1,C 1:i-1 )=γ i,i-l i +θ q,iP(A i =1|E i =1,F=0)=α q,i
P(A i =1|E i =1,F=1)=α q,i +β q,i
P(B=1|F=0)=0
P(B=1|F=1)=σ t v ,l v

其描述的用户浏览行为决策过程可以用图 7 表示。用户在开始浏览时,他会有一定的几率决定是否首先去检验垂直结果,如果检验了垂直结果,那么用户会继续约定是否回到页面顶端自上而下浏览,亦或是自下而上反序浏览。

时间: 2024-09-16 07:45:57

《中国人工智能学会通讯》——9.27 针对垂直搜索结果的点击模型的相关文章

《中国人工智能学会通讯》——11.65 双重代价敏感的属性分类模型

11.65 双重代价敏感的属性分类模型 现有属性学习方法中,所有的目标类通常共享一组公共属性,即这些公共属性构成目标对象的表达特征空间.特别是当对象来自很多目标类时,这种表达方式有利于实现不同类之间的知识共享.然而,利用共享属性表示方法会导致类别不平衡问题.即对于某个特定属性,并非所有的目标类在该属性上都有响应,因此相应属性分类任务很可能面临严重的类别不平衡问题.例如,在 Animals WithAttributes 数据集上进行"Blue"属性分类时,负例样本有 23 353 个,而

《中国人工智能学会通讯》——9.25 搜索引擎点击模型综述

9.25 搜索引擎点击模型综述 在这个信息爆炸的时代,搜索引擎已成为人们在互联网的数据海洋中遨游不可或缺的工具.无论是查找信息.获取资源,还是寻求帮助.发现机遇,都离不开搜索引擎的指引与参考.可以说,搜索引擎已经成为了互联网中的"基础设施".根据中国互联网络中心(CNNIC)发布的中国互联网络发展状况统计报告显示,截止 2016 年 1 月 , 已有82.3% 的互联网用户使用搜索引擎 , 在互联网网络应用中排名第二 ; 而在移动端也有 77.1% 的用户使用移动端搜索引擎 , 在移动

中国人工智能学会通讯——无智能,不驾驶——面向未来的智能驾驶时代 ( 下 )

到目前为止似乎比较完美,而实际还 存在着一些问题.我们现在看到很多道 路上面,交通标志牌它的分布非常稀疏, 可能每过一两公里才能够检测出来一个 交通标志牌,因为毕竟这个深度学习算 法是目前最完美的,它有时候还会错过 一个交通标志牌,这时候怎么办呢?我 们会发现在路面上也有非常明显的视觉 特征,我只要把路面的这些视觉特征识 别出来进行匹配,其实是有连续的绝对 的视觉参考的.所以我们做的办法是, 把这个路面粘贴起来.这个粘贴的方法 很简单,跟我们手机拍场景图片一样, 我们慢慢移动的时候可以把这个场景

中国人工智能学会通讯——2016机器智能前沿论坛召开

2016 年 12 月 17 日,由中国人工智能学会.中国工程院战略咨询中心主办,今日头条.IEEE<计算科学评论>协办的"2016机器智能前沿论坛"暨"2016 BYTE CUP国际机器学习竞赛颁奖仪式"在中国工程院举办.论坛嘉宾包括中外顶尖的数据挖掘.机器学习,以及自然语言处理方向的专家学者. 与以往不同,本次论坛除介绍机器学习的重大进展和应用外,还着重讨论了机器学习技术在媒体数据上的应用,并为2016 BYTE CUP 国际机器学习竞赛的获奖选手进

中国人工智能学会通讯——混合智能概念与新进展

脑科学以阐明脑的工作原理为目标,近年来已成为最重要的科学前沿领域之一.脑功能计算.脑智能模仿再度成为学术界和产业界热议话题[1-4].欧盟.美国.日本相继启动了大型脑研究计划,强有力推动了人们对脑结构.脑功能和脑智能的探索和认识:另一方面,人工智能研究风起云涌,最近一个标志性事件是谷歌的AlphaGo以4:1战胜围棋世界冠军李世石[5],实现了围棋人工智能领域史无前例的突破.2016年9月斯坦福大学发布了<2030年的人工智能与生活>报告[6],全面评估了当前人工智能的进展.挑战.机遇与展望.

中国人工智能学会通讯——机器学习里的贝叶斯基本理论、模型和算法

非常感 谢周老师给这个机会让我跟大家分享一下.我今天想和大家分享的是,在深度学习或者大数据环境下我们怎么去看待相对来说比较传统的一类方法--贝叶斯方法.它是在机器学习和人工智能里比较经典的方法. 类似的报告我之前在CCF ADL讲过,包括去年暑假周老师做学术主任在广州有过一次报告,大家如果想看相关的工作,我们写了一篇文章,正好我今天讲的大部分思想在这个文章里面有一个更系统的讲述,大家可以下去找这篇文章读. 这次分享主要包括三个部分: 第一部分:基本理论.模型和算法 贝叶斯方法基础 正则化贝叶斯推

中国人工智能学会通讯——深蓝、沃森与AlphaGo

在 2016 年 3 月 份,正当李 世石与AlphaGo 进行人机大战的时候,我曾经写过 一 篇< 人 工 智 能 的 里 程 碑: 从 深 蓝 到AlphaGo>,自从 1997 年深蓝战胜卡斯帕罗夫之后,随着计算机硬件水平的提高,计算机象棋(包括国际象棋和中国象棋)水平有了很大的提高,达到了可以战胜人类最高棋手的水平.但是,长期以来,在计算机围棋上进展却十分缓慢,在 2006 年引入了蒙特卡洛树搜索方法之后,也只能达到业余 5 段的水平.所以 AlphaGo 战胜韩国棋手李世石,确实是人

中国人工智能学会通讯——深度学习与视觉计算 1.3 计算机视觉领域利用深度学习可能带来的未来研究方向

1.3 计算机视觉领域利用深度学习可能带来的未来研究方向 第一个,深度图像分析.目前基于深度 学习的图像算法在实验数据库上效果还是 不错的,但是远远不能够满足实际大规模 应用需求,需要进一步的提升算法性能从 而能够转化相应的实际应用.比如这个基 于图片的应用,可以估计性别和年龄,但 是其实经常会犯错,因此需要进一步提升 深度图像分析的性能. 第二个,深度视频分析.视频分析牵扯 到大量的数据和计算量,所以做起来更加 麻烦.当前深度视频分析还处于起步的阶 段,然而视频应用非常广泛,比如人机交互. 智

中国人工智能学会通讯——智创未来 未来已来

2016 年带着我们难忘的记忆,就这样翻篇了.由我们学会发起.全国多个组织积极参与的.纪念全球人工智能 60 年的一个个系列活动历历在目,在我们身边发生的种种无人驾驶的比赛和试验活动还在让我们激动不已,AlphaGo 战胜人类围棋冠军李世石的震荡被 Master 的新战绩推向又一个新高潮,时间就这样把我们带入了新的一年--2017 年. 对 2017 年的人工智能,我们会有什么期待呢? 深度学习会火 无人驾驶会火 机器人产业会火 机器同传会火 人机博弈会火 交互认知会火 不确定性人工智能会火 智