《中国人工智能学会通讯》——12.28 推断模型

12.28 推断模型

本章中给出一个推断模型,根据工人给任务的答案,它能够推断任务的关键词的真实结果。下面首先介绍模型的核心思想,然后给出模型构建与模型学习的一些细节。

建模核心思想 : 工人答案准确率的是建模的核心。 主要考虑如下因素对工人答案准确率的影响。

(1) 工人质量。它包含两个部分。① 工人自身质量。由于工人自身能力与背景知识的差别,每个工人有不同的自身质量。自身质量很低的工人,比如说一些恶意的工人或者对任务完全一无所知的工人,他们给出的答案往往是易错的。② 距离相关质量。工人对任务给出的答案质量还与任务与工人之间的距离有关联。直观上,工人由于对其附近的事物比较熟悉,因此对距离近的任务比距离远的任务往往能给出更准确的答案。不同的工人受距离的影响不同,部分工人仅对附近的一部分任务有比较好的了解;反之有些工人对距离不是特别敏感,即使距离较远,他们也能给出比较准确的答案。

(2) 任务兴趣点的影响力。同样需要考虑任务对应兴趣点的影响力对答案质量的影响。一方面,有些任务对应的兴趣点有一定的知名度,许多工人对这些兴趣点都有一定的背景知识,因此这些任务能比较容易获得准确的答案。在另一方面 , 有些兴趣点影响力较小,只有附近的工人对它们有了解。

模型细节: 根据上述,提出了一个概率图模型,如图 2 所示。在这个概率模型中,工人质量以及任务影响力都由随机变量参数来表示。该模型主要包括四个要素。
(1) 真实结果。用一个二元随机变量 z t,k 来代表关键词 l t,k 的真实结果。 若 l t,k 是任务 t 的一个正确关键词 , 那么 z t,k =1;否则 z t,k =0。 z t,k 满足一个二元分布,即 P(z t,k =1) 表示 l t,k 是一个正确关键词的概率。推断模型最终通过计算P(z t,k )来推断l t,k 的真实结果,如果 P(z t,k =1) ≥ 0.5,则推断 l t,k 是一个正确关键词。

(2) 工人自身质量。 用一个随机变量 i w 来表示工人 w 的自身质量。i w 同样满足伯努利分布,即P(i w =1) 和 P(i w =0)=1-P(i w =1) 分别表示 w 是 l 一个具有高或者低自身质量工人的概率。

(3) 距离相关质量。设 d(w,t) 为工人 w 和任务 t 之间的规则化欧式空距离 (0 ≤ d(w,t) ≤ 1),d(w,t) 越小,那 w 给出一个正确答案的可能性就会越高。使用一种钟形函数来体现这种性质,即, 其中 λ 是一个用于在 d(w,t)增长情况下控制函数值下降粒度的参数,λ 较大 , 则工人质量值下降较快。距离公式集合 F={f λ 1 , f λ 2 ,...,f λ |F| } 由一组固定的钟形函数构成 , 它们相关质量都逐渐降低 , 但降低的幅度并不相同。工人 w 对任务 t的距离相关质量是在距离公式集合上距离函数的一个线性组合 , 即 P(d w=fλ i )*f λ i (d(w,t))。其中 d w 是在距离公式集合上满足多元分布的一个随机变量。P(d w=fλ ) 可以认为是 f λ 在线性组合中的权重。由于不同的工人有不同的权重分布,d w 的分布反映了距离对质量的不同影响程度。

(4) 任务兴趣点影响力。相似地,基于距离公式集合给出任务兴趣点的影响力 (d t ),同样是一组距离函数的线性组合。

模型学习 : 结合以上描述,我们通过最大化模型中的观察值 r w,t,k 来估算参数。假定所有的答案(rw,t,k ) 是独立的,该方法最大化所有工人答案的可能性,即 argmax z t,k ,i w ,d w ,d t P(r w,t,k )。对应最大化可能性的 P(z t,k ) 就是模型推断的关键词是否正确的依据。 这里采用期望最大化算法来推导 P(z t,k ),推倒细节省略 , 具体见文献 [2]。

时间: 2024-09-20 05:06:18

《中国人工智能学会通讯》——12.28 推断模型的相关文章

中国人工智能学会通讯——机器学习里的贝叶斯基本理论、模型和算法

非常感 谢周老师给这个机会让我跟大家分享一下.我今天想和大家分享的是,在深度学习或者大数据环境下我们怎么去看待相对来说比较传统的一类方法--贝叶斯方法.它是在机器学习和人工智能里比较经典的方法. 类似的报告我之前在CCF ADL讲过,包括去年暑假周老师做学术主任在广州有过一次报告,大家如果想看相关的工作,我们写了一篇文章,正好我今天讲的大部分思想在这个文章里面有一个更系统的讲述,大家可以下去找这篇文章读. 这次分享主要包括三个部分: 第一部分:基本理论.模型和算法 贝叶斯方法基础 正则化贝叶斯推

中国人工智能学会通讯——2016机器智能前沿论坛召开

2016 年 12 月 17 日,由中国人工智能学会.中国工程院战略咨询中心主办,今日头条.IEEE<计算科学评论>协办的"2016机器智能前沿论坛"暨"2016 BYTE CUP国际机器学习竞赛颁奖仪式"在中国工程院举办.论坛嘉宾包括中外顶尖的数据挖掘.机器学习,以及自然语言处理方向的专家学者. 与以往不同,本次论坛除介绍机器学习的重大进展和应用外,还着重讨论了机器学习技术在媒体数据上的应用,并为2016 BYTE CUP 国际机器学习竞赛的获奖选手进

中国人工智能学会通讯——混合智能概念与新进展

脑科学以阐明脑的工作原理为目标,近年来已成为最重要的科学前沿领域之一.脑功能计算.脑智能模仿再度成为学术界和产业界热议话题[1-4].欧盟.美国.日本相继启动了大型脑研究计划,强有力推动了人们对脑结构.脑功能和脑智能的探索和认识:另一方面,人工智能研究风起云涌,最近一个标志性事件是谷歌的AlphaGo以4:1战胜围棋世界冠军李世石[5],实现了围棋人工智能领域史无前例的突破.2016年9月斯坦福大学发布了<2030年的人工智能与生活>报告[6],全面评估了当前人工智能的进展.挑战.机遇与展望.

中国人工智能学会通讯——无智能,不驾驶——面向未来的智能驾驶时代 ( 下 )

到目前为止似乎比较完美,而实际还 存在着一些问题.我们现在看到很多道 路上面,交通标志牌它的分布非常稀疏, 可能每过一两公里才能够检测出来一个 交通标志牌,因为毕竟这个深度学习算 法是目前最完美的,它有时候还会错过 一个交通标志牌,这时候怎么办呢?我 们会发现在路面上也有非常明显的视觉 特征,我只要把路面的这些视觉特征识 别出来进行匹配,其实是有连续的绝对 的视觉参考的.所以我们做的办法是, 把这个路面粘贴起来.这个粘贴的方法 很简单,跟我们手机拍场景图片一样, 我们慢慢移动的时候可以把这个场景

中国人工智能学会通讯——深度学习与视觉计算 1.3 计算机视觉领域利用深度学习可能带来的未来研究方向

1.3 计算机视觉领域利用深度学习可能带来的未来研究方向 第一个,深度图像分析.目前基于深度 学习的图像算法在实验数据库上效果还是 不错的,但是远远不能够满足实际大规模 应用需求,需要进一步的提升算法性能从 而能够转化相应的实际应用.比如这个基 于图片的应用,可以估计性别和年龄,但 是其实经常会犯错,因此需要进一步提升 深度图像分析的性能. 第二个,深度视频分析.视频分析牵扯 到大量的数据和计算量,所以做起来更加 麻烦.当前深度视频分析还处于起步的阶 段,然而视频应用非常广泛,比如人机交互. 智

中国人工智能学会通讯——智创未来 未来已来

2016 年带着我们难忘的记忆,就这样翻篇了.由我们学会发起.全国多个组织积极参与的.纪念全球人工智能 60 年的一个个系列活动历历在目,在我们身边发生的种种无人驾驶的比赛和试验活动还在让我们激动不已,AlphaGo 战胜人类围棋冠军李世石的震荡被 Master 的新战绩推向又一个新高潮,时间就这样把我们带入了新的一年--2017 年. 对 2017 年的人工智能,我们会有什么期待呢? 深度学习会火 无人驾驶会火 机器人产业会火 机器同传会火 人机博弈会火 交互认知会火 不确定性人工智能会火 智

中国人工智能学会通讯——深蓝、沃森与AlphaGo

在 2016 年 3 月 份,正当李 世石与AlphaGo 进行人机大战的时候,我曾经写过 一 篇< 人 工 智 能 的 里 程 碑: 从 深 蓝 到AlphaGo>,自从 1997 年深蓝战胜卡斯帕罗夫之后,随着计算机硬件水平的提高,计算机象棋(包括国际象棋和中国象棋)水平有了很大的提高,达到了可以战胜人类最高棋手的水平.但是,长期以来,在计算机围棋上进展却十分缓慢,在 2006 年引入了蒙特卡洛树搜索方法之后,也只能达到业余 5 段的水平.所以 AlphaGo 战胜韩国棋手李世石,确实是人

中国人工智能学会通讯——着力突破与创新 实现超越与引领

提 要 2016年3月,围棋人机大战的结果,在舆论界激起了惊涛骇浪:在科技界也引起了强烈反响.为了把握人工智能的发展现状和规律,探讨我国人工智能的发展战略,在中国人工智能学会和众多人工智能同行的支持下,由本文作者出面申请了一次高层战略研讨会,这就是以"发展人工智能,引领科技创新"为主题的香山科学会议.与会者同气相求.同心协力,站在国家战略的高度,以纵览全球的视野,通过深入的研讨和论证,凝聚了诸多宝贵的共识,形成了直送中央的<关于加快发展我国人工智能的专家建议>.本文简要介绍

中国人工智能学会通讯——Master虽优势较多 但仍有缺陷

近日,Master 在各大围棋网站横扫顶尖职业棋手,随后,谷歌 DeepMind 创始人德米什 • 哈萨比斯在 Twitter 上发布消息,证实了 Master 是 AlphaGo 的升级版.众所周知,围棋困难的地方在于它的估值函数非常不平滑,差一个子盘面就可能天翻地覆:同时状态空间大,也没有全局的结构.这两点加起来,迫使目前计算机只能用穷举法,并且因此进展缓慢.但人能下得好,能在几百个选择中知道哪几个位置值得考虑,说明它的估值函数是有规律的.这些规律远远不是几条简单公式所能概括,但所需的信息量