《中国人工智能学会通讯》——12.37 众包机器协同的知识库补全技术

12.37 众包机器协同的知识库补全技术

本章介绍众包机器协同的知识库补全技术,用来进行有效的成本控制,基本思想包含两方面。第一,众包任务选择,即在一定预算约束下,选择最有“收益”的任务进行众包;第二,众包任务推理,即给定众包反馈的答案,利用机器算法推理未被众包解答的答案。首先会在 4.1 节介绍知识库补全的重要途径,知识库与 HTML 表格融合;进而在 4.2节给出基于众包机器协同进行融合的方法介绍。更详细的内容参见文献 [33]。

时间: 2024-12-24 17:24:49

《中国人工智能学会通讯》——12.37 众包机器协同的知识库补全技术的相关文章

《中国人工智能学会通讯》——7.9 机器阅读理解评测数据集

7.9 机器阅读理解评测数据集 现阶段,和阅读理解相关的数据集主要有以下五个. 1 . MCTest 微 软 研 究 院 的 研 究 员 Richardson et al [1] 在2013 年的 EMNLP 上发布了一个数据集.在这个数据集中,所有的文档都是一些叙述性的故事.它考察的推理能力被限定于一个 7 岁儿童可以接受的范围内,包含有许多常识性的推理,这些推理既包含事实性的,也包含非事实性的.这个数据集包含有两部分,一个是 MC160,还有一个是 MC500,分别包含 160 篇和 500

《中国人工智能学会通讯》——4.24 机器的视觉注意

4.24 机器的视觉注意 1 . 表达方式 对于给定的图像或视频数据,机器的视觉注意过程是希望能找到场景中较为显著(或突出)的区域,其输出结果一般采用视觉显著度图(Saliency Map)的形式.其中每个空间位置的显著性一般用值域为 [0,1]的概率值来表示.概率值越大,表示该位置越有可能成为人类视觉关注的目标.以图 1 为例,图中第一行为原始输入影像:第二行为视觉显著度图(每个像素的灰度值是将其对应位置的概率值线性放大到值域[0,255],并予以显示).图像中强度越高的区域表示越有可能是兴趣

中国人工智能学会通讯——人类作为“情感机器”——效用函数、情绪和社会偏好 1.1 效用函数

1.1 效用函数 效用函数是一个经济学概念,指的是客观事物到主观价值之间的映射关系,最初由数学家Daniel Bernoulli在1738年引入,用于解释人们在风险决策中的不理性倾向[8].描述人类决策行为的经济学和心理学理论,大多建立在效用函数之上[9].效用函数随个体而异,不同个体可能赋予同一事物不同的主观价值,正所谓"彼之蜜糖,吾之砒霜". 21世纪初,研究者首先在非人灵长类动物的脑中,发现了表征主观价值的神经信号[10].Padoa-Schioppa和Assad让干渴的猴子在味

《中国人工智能学会通讯》——11.47 领域文本中的实体链接技术

11.47 领域文本中的实体链接技术 除了通用知识库,我们还拥有很多领域知识库(如 DBLP 文献网络 .IMDb 电影网络).将领域文本中的命名实体链接到相应领域知识库,对领域文本的分析和领域知识库的扩充非常有帮助.目前主流的实体链接算法都是针对通用的维基百科或者由维基百科生成的知识库(如 YAGO),这些算法都依赖于与维基百科相关的特征,例如维基百科文章中的上下文文本信息.基于维基百科的相关度度量,以及维基百科的一些特殊结构(如排歧页面.跳转页面等).由于领域知识库并不具备这些特征,所以之前

《中国人工智能学会通讯》——第6章 6.1 基于深度学习技术的知识图谱构建技术研究

第6章 6.1 基于深度学习技术的知识图谱构建技术研究 随着互联网.云计算等技术的发展,信息资源不断丰富,人们的知识需求也有所增长.如何正确理解知识需求,定位和提取相关的知识,并提供有效的知识服务,是知识工程的重要研究问题.其中,知识图谱作为目前主流的知识工程基础技术,支撑着包括智能搜索.智能问答.个性化推荐等多种知识服务,涉及到知识表示.知识获取.知识融合.知识推理等关键技术. 知识图谱是对知识的结构化表示,其核心思想是将现实世界的知识表达为实体和实体之间关系的形式.实际上,在知识图谱被提出之

《中国人工智能学会通讯》——12.32 基于众包的知识库补全研究

12.32 基于众包的知识库补全研究 近些年来,大规模知识库构建逐渐成为学术界和工业界广泛关注的热点.一批大规模知识库得以构建,并得到了迅猛的发展,这其中包括学术界构建的知识库 YAGO [1] .NELL [2] .DBpedia [3]和 DeepDive [4] ,工业界开发的 Freebase [5] .谷歌公 司 的 Knowledge Graph [6] .Wolfram Alpha [7] , 以及特定领域的知识库 , 如医疗领域的 UMLS [8] .这些知识库包含了数以亿计的真

《中国人工智能学会通讯》——12.39 众包机器协同技术介绍

12.39 众包机器协同技术介绍 众包机器协同技术的核心想法是众包任务选择,即在一定预算约束下,选择最有"收益"的任务分配给众包工人进行求解.具体来讲,由于存在大量的 HTML 表格,而金钱上的预算又是有限的,假设为 k,能否精心挑选最有"收益"的 k 个表格中的列,让众包将它链接到知识库的概念上.剩余的列可以通过机器的方法,如基于文本相似性或图结构相似性进行匹配,或基于众包答案进行推理. 不难看出,众包机器协同技术的核心挑战在于如何定义"收益"

《中国人工智能学会通讯》——12.42 总结

12.42 总结 本文介绍了基于众包的知识库补全技术.首先介绍了众包的计算模型,归纳了三类知识补全任务,即知识标注.知识链接和规则判断:其次,介绍了自适应的任务分配技术以解决众包知识库补全的质量控制问题:最后,介绍了众包机器协同技术以解决众包知识库补全的成本控制问题.然而,需要说明的是,本文只是对众包知识库补全的初步解决,还有很多有挑战的问题需要研究.例如,如何建立统一的众包机器框架以解决三类知识补全任务,如何控制众包任务的延迟等.

《中国人工智能学会通讯》——12.33 众包知识库补全方法概览

12.33 众包知识库补全方法概览 本章介绍众包知识库补全的方法概览,如图 1所示.其基本思想包含两个部分,其一,利用多种数据源,如现有的多个知识库.Web 结构化数据等,提取知识数据,并将不同数据源的知识数据融合起来,以此补全知识库:其二,在融合的过程中有效地利用众包,通过众包模型细化出具体可供众包完成的任务,利用众包优化算法进行质量和成本的控制,以选择出最优的任务发布到众包平台,如美国亚马逊公司的 Mechanical Turk ( 简称 MTurk) 1 . 知识抽取:提出利用多类数据源进