《中国人工智能学会通讯》——12.36 自适应任务分配技术

12.36 自适应任务分配技术

上节介绍的众包工人领域差异性对众包质量控制提出了两点新的要求,第一,能否估计众包工人在不同领域可能存在较大差异的准确率,并随着工人答题不断对估计进行更新;第二,能否根据估计的准确率,自适应地将任务分配给所属领域的“专家”,即准确率高的工人。为了达成这两点要求,本文提出自适应的任务分配技术 iCrowd。

图 3 给出了自适应任务分配 iCrowd 技术框架。该技术针对一组众包任务(Microtasks)进行分配,通过众包平台(Crowdsourcing Platform)利用众包进行求解。每当工人(Worker)请求任务时,iCrowd 对工人的类型进行如下判断。

● 针对新工人(New Worker),iCrowd 通过Warm-Up 模块分配一些考试题(Q-Tasks),并通过工人的答案(QTask Answers)初步估计其准确率。

● 针 对 已 通 过 考 试 题 的 工 人(QualifiedWorker),自适应分配模块(Adaptive Assigner)对其进行任务分配:通过准确率估计模块(AccuracyEstimator)分析其已完成的历史任务,估计出工人在不同领域的准确率,进而通过任务分配模块(Microtask Assigner)将任务分配给准确率最高的工人进行解答。注意,以上估计 - 分配过程是不断进行的,随着工人答题数量的增加,准确率的估计会持续更新,任务分配也会根据更新的准确率自适应的修正。

框架中最核心的挑战在准确率估计(AccuracyEstimator)和任务分配(Microtask Assigner)模块,下面简介它们的思想,具体技术细节见文献 [34]。

准确率估计:核心的想法是把众包任务构建成图模型,结点表示任务,边表示任务之间的领域相似关系。例如,在判断篮球运动员国籍时,可以把每一任务建模成结点,如果两个任务比较相似,则在他们之间建一条边,并标注上相似性。其中相似性可以基于文本相似性,或是实体关系在知识库中的结构进行定义。基于上述图模型,准确率估计首先计算某一工人在已回答问题上的准确率,进而基于此估计其在未回答问题上的准确率。例如,某工人在补全篮球运动员的任务上表现出色,而在补全政治家的任务上很差,估计技术就给与前者相似的任务较大准确率,与后者相似的任务较小准确率。为了实现这一想法,在技术上,iCrowd 将估计问题形式化为综合考虑局部相似性和全局相似性的优化问题,并给出了高效策略进行优化求解与更新。

自适应任务分配:核心的想法是将某一任务分配给能完成它的准确率最高的 k 个工人。在此前提下,还需要考虑尽快将任务完成,从而进一步触发准确率估计模块更新工人的准确率。iCrowd 将自适应任务分配进行了形式化,证明找到最优分配方案是一个 NP 难问题,并提供了一个有效的方法进行近似求解。此外,iCrowd 也提出了考试题挑选方法,其基本想法是挑选那些“影响力”最大的任务作为考试题,使工人回答了这些任务后,iCrowd 可以在最大范围内估计他在其它题目可能的准确率。

时间: 2024-07-29 12:03:03

《中国人工智能学会通讯》——12.36 自适应任务分配技术的相关文章

《中国人工智能学会通讯》——4.28 数据挖掘技术在电子数据取证中的应用

4.28 数据挖掘技术在电子数据取证中的应用 电子数据取证过程中会获得大量的证据数据,主要来源于三个方面,一是计算机主机系统方面的证据,主要包括来自硬盘.内存.外设中的数据:二是来自网络方面的证据,主要包括实时获取的网络通信数据流网络设备上产生的记录,以及网络安全设备上的日志和登录日志:三是来自其他数字设备的证据,如手机.手持电子设备.这些可疑数据的数据量非常庞大并且不断更新,面对这样庞大的.变化的数据,单纯依靠技术人员的经验去分析.去获取有用的证据是不现实的,需要借助工具从海量的数据中获取有用

《中国人工智能学会通讯》——6.8 主要技术挑战和近期进展

6.8 主要技术挑战和近期进展 近年来,虽然实体链接技术取得了长足的进展,并得到了一定程度的应用.但是实体链接任务仍有很多问题尚未解决,需要进一步的研究和探索.以下列举几个实体链接的主要技术挑战及相关进展. 实体名的歧义性和多样性.歧义性和多样性是自然语言的固有属性,也是实体链接的根本难点所在.因此如何挖掘更多.更有效的消歧证据,设计更高性能的消歧算法,构建覆盖度更高的实体引用表仍然是实体链接系统的核心研究问题. 实体链接系统的效率.考虑到实体链接系统面向的文本规模(Web 网页集合)和大部分应

中国人工智能学会通讯——混合智能概念与新进展

脑科学以阐明脑的工作原理为目标,近年来已成为最重要的科学前沿领域之一.脑功能计算.脑智能模仿再度成为学术界和产业界热议话题[1-4].欧盟.美国.日本相继启动了大型脑研究计划,强有力推动了人们对脑结构.脑功能和脑智能的探索和认识:另一方面,人工智能研究风起云涌,最近一个标志性事件是谷歌的AlphaGo以4:1战胜围棋世界冠军李世石[5],实现了围棋人工智能领域史无前例的突破.2016年9月斯坦福大学发布了<2030年的人工智能与生活>报告[6],全面评估了当前人工智能的进展.挑战.机遇与展望.

中国人工智能学会通讯——2016机器智能前沿论坛召开

2016 年 12 月 17 日,由中国人工智能学会.中国工程院战略咨询中心主办,今日头条.IEEE<计算科学评论>协办的"2016机器智能前沿论坛"暨"2016 BYTE CUP国际机器学习竞赛颁奖仪式"在中国工程院举办.论坛嘉宾包括中外顶尖的数据挖掘.机器学习,以及自然语言处理方向的专家学者. 与以往不同,本次论坛除介绍机器学习的重大进展和应用外,还着重讨论了机器学习技术在媒体数据上的应用,并为2016 BYTE CUP 国际机器学习竞赛的获奖选手进

中国人工智能学会通讯——机器学习里的贝叶斯基本理论、模型和算法

非常感 谢周老师给这个机会让我跟大家分享一下.我今天想和大家分享的是,在深度学习或者大数据环境下我们怎么去看待相对来说比较传统的一类方法--贝叶斯方法.它是在机器学习和人工智能里比较经典的方法. 类似的报告我之前在CCF ADL讲过,包括去年暑假周老师做学术主任在广州有过一次报告,大家如果想看相关的工作,我们写了一篇文章,正好我今天讲的大部分思想在这个文章里面有一个更系统的讲述,大家可以下去找这篇文章读. 这次分享主要包括三个部分: 第一部分:基本理论.模型和算法 贝叶斯方法基础 正则化贝叶斯推

中国人工智能学会通讯——无智能,不驾驶——面向未来的智能驾驶时代 ( 下 )

到目前为止似乎比较完美,而实际还 存在着一些问题.我们现在看到很多道 路上面,交通标志牌它的分布非常稀疏, 可能每过一两公里才能够检测出来一个 交通标志牌,因为毕竟这个深度学习算 法是目前最完美的,它有时候还会错过 一个交通标志牌,这时候怎么办呢?我 们会发现在路面上也有非常明显的视觉 特征,我只要把路面的这些视觉特征识 别出来进行匹配,其实是有连续的绝对 的视觉参考的.所以我们做的办法是, 把这个路面粘贴起来.这个粘贴的方法 很简单,跟我们手机拍场景图片一样, 我们慢慢移动的时候可以把这个场景

中国人工智能学会通讯——深蓝、沃森与AlphaGo

在 2016 年 3 月 份,正当李 世石与AlphaGo 进行人机大战的时候,我曾经写过 一 篇< 人 工 智 能 的 里 程 碑: 从 深 蓝 到AlphaGo>,自从 1997 年深蓝战胜卡斯帕罗夫之后,随着计算机硬件水平的提高,计算机象棋(包括国际象棋和中国象棋)水平有了很大的提高,达到了可以战胜人类最高棋手的水平.但是,长期以来,在计算机围棋上进展却十分缓慢,在 2006 年引入了蒙特卡洛树搜索方法之后,也只能达到业余 5 段的水平.所以 AlphaGo 战胜韩国棋手李世石,确实是人

中国人工智能学会通讯——深度学习与视觉计算 1.3 计算机视觉领域利用深度学习可能带来的未来研究方向

1.3 计算机视觉领域利用深度学习可能带来的未来研究方向 第一个,深度图像分析.目前基于深度 学习的图像算法在实验数据库上效果还是 不错的,但是远远不能够满足实际大规模 应用需求,需要进一步的提升算法性能从 而能够转化相应的实际应用.比如这个基 于图片的应用,可以估计性别和年龄,但 是其实经常会犯错,因此需要进一步提升 深度图像分析的性能. 第二个,深度视频分析.视频分析牵扯 到大量的数据和计算量,所以做起来更加 麻烦.当前深度视频分析还处于起步的阶 段,然而视频应用非常广泛,比如人机交互. 智

中国人工智能学会通讯——智创未来 未来已来

2016 年带着我们难忘的记忆,就这样翻篇了.由我们学会发起.全国多个组织积极参与的.纪念全球人工智能 60 年的一个个系列活动历历在目,在我们身边发生的种种无人驾驶的比赛和试验活动还在让我们激动不已,AlphaGo 战胜人类围棋冠军李世石的震荡被 Master 的新战绩推向又一个新高潮,时间就这样把我们带入了新的一年--2017 年. 对 2017 年的人工智能,我们会有什么期待呢? 深度学习会火 无人驾驶会火 机器人产业会火 机器同传会火 人机博弈会火 交互认知会火 不确定性人工智能会火 智