《中国人工智能学会通讯》——1.2 问答与智能信息获取

1.2 问答与智能信息获取

问答系统作为智能表征的研究领域,几十年来一直受到学术界的关注,国际评测 TREC 历经十余年对问答系统从几个方面进行了评测[4] 。问答系统的发展杂问题的发展过程,逐步具有了更多的智能行为特性。这个过程并不是一个单纯的直线,而是反反复复螺旋式进步。早期的问答系统虽然可以回答特定类型的问题,但是覆盖度和鲁棒性都比较差,速度也比较慢,还不能很好地应用在真实的商业系统中。

互联网大数据的产生,使问答系统在几个方面获得了改善的机会。一个是信息源数据的丰富,使得从人工构建语料库发展到从互联网获取海量有针对性的语料,如问答社区,即时通讯软件等。另一个是知识库,从人工定义特定领域知识库,发展到大规模知识图 谱 的 构 建, 例 如 YAGO [5] 、Freebase [6] 、Google 的Knowledge Graph [7] 以及 NELL [8] 。这些知识库从知识工程的角度体系化地组织了人类关于世界的认知,广度和深度都达到了空前的地步,并且还在不断的发展中。此外,互联网还存在海量的多源异构信息,包括地理信息、用户的行为日志等。这些前所未有的信息内容可以用来构建用户模型,帮助系统理解用户意图,产生更加个性化的答案,改善用户体验。

然而,从另外一个角度,互联网时代给问答系统带来的最大改变是其在信息时代的角色转变。问答系统已经不仅仅是表现、测试计算机系统智能水平的平台,关注点从细节诸如解决事实性问题还是复杂问题,亦或是基于检索的还是基于数据库的转变为更加宏观与系统。问答系统作为信息查询 / 获取的入口,是一种公认的友好而自然的人机交互形式,一个信息服务的平台。互联网的发展使我们从数据缺乏的时代进步到信息丰富的时代,但是也带来了信息过剩的挑战。对于用户来说,麻烦已经不是找不到信息,而是信息太多,噪音太大。有效率地获取最符合用户意图的信息,即为所谓的智能信息获取已经互联网信息处理的重中之重的问题。智能信息获取最自然的手段是问答,而问答系统可以通过各种智能信息处理技术以知识库和互联网数据为背景,得到满足查询相关性、重要性、时效性等要求的、直截了当的答案,提高系统的鲁棒性、覆盖度及工作效率。以智能信息获取为目标的问答系统,既可以向通往图灵测试的道路迈出坚实一步,也是从人本的角度出发,满足用户需要,给予用户最好的智能体验的,具有非常重要社会效益的计算机系统。因而,问答系统完全从后台走到了前台,而当前成功经历了从特定领域到非特定领域,从事实性问题到复的问答系统,大多是从这条路线出发:首先对问答的形式、信息源进行分类细化,针对不同的问题类型进行问题解析、答案候选生成,以及答案排序等工作,涉及到自然语言处理、信息检索、知识计算、推理等众多人工智能相关技术,取得了很多的成就,并随着深度学习等新一代智能计算模型的发展而进步,有着美好的前景。

时间: 2024-08-21 17:20:00

《中国人工智能学会通讯》——1.2 问答与智能信息获取的相关文章

中国人工智能学会通讯——大数据与认知智能

今天的主题是机器学习和人工智能.首先讲机器学习,刚刚铁岩给了很好的介绍.如果用从处理数据集x和目标y的角度对机器学习进行简单分类,可以大致归纳为以下三点:第一,对于Supervised Learning,学习的核心是从x到y的映射.如果目标y是离散的,它就是分类问题,例如人脸识别就是一个机器学习的分类问题:如果这个y是连续变量,那就是回归问题,比如对雾霾的预测就利用了回归的方法.第二,对于Unsupervised Learning,只有一个x,没有y.第三,增强学习处于监督学习和非监督学习之间.

中国人工智能学会通讯——机器人组件技术在智能制造系统中的应用

摘要:随着工业4.0时代的到来,如何将传统工厂改造成为个性化.网络化.柔性生产的智能制造系统成为了当前的研究热点.本文从智能制造系统和智能机器人系统的相似性出发,构建了基于机器人组件技术的智能制造系统,对智能制造系统中各个生产单元进行组件化技术封装,实现了生产组件之间的信息互联和即插即用,通过个性化订单要求对各生产组件在线任务规划,达到柔性生产的目标.此外用多异构机器人模拟各工位生产单位搭建了一个可以根据用户订单生产的小型智能制造实验平台,实验结果验证了本研究构建系统的可行性. 关键词:机器人组

中国人工智能学会通讯——打造云上视觉智能生态 1.4 视觉智能实例:城市之眼

1.4 视觉智能实例:城市之眼 视觉之眼,是城市的眼睛.我们要处理的是城市的摄像头,不管是交通.安防.城管,还是个人的,这些摄像头的数据,我们思考怎样把它的价值挖掘出来.里面涉及到的技术仍然是视觉数据的检测.识别.系统.搜索.挖掘等. 这个例子是交通视频的分析,对车辆的检测.车辆的跟踪.车辆的属性,就是将路面上发生的事情了解个底朝天.过去做交通优化时有两个信息源,第一个是地感线圈:但线圈数据不知道这个车的属性.车类型.车多长,这个车到哪里去了,这个信息不全.第二个数据,是GPS的数据,但一般只有

《中国人工智能学会通讯》——11.57 基于扩展信息的移动App分类方法

11.57 基于扩展信息的移动App分类方法 移动 App 在移动用户的日常生活中扮演着十分重要的角色,通过研究其使用记录可以帮助深入理解用户的兴趣偏好,并且能够促成许多潜在的智能应用服务,例如移动 App 推荐.移动用户定向广告.移动用户市场分析等. 然而,我们在实践中发现,直接来自于移动App 的信息通常非常有限并且语义模糊.例如一个用于分析用户偏好的模型很难清晰地理解 App 使用记录:"用户正在玩 Angry Birds",除非相应的App 能够被识别为一个预先设定好的语义类别

《中国人工智能学会通讯》——3.2 基于网络结构信息的网络表示方法

3.2 基于网络结构信息的网络表示方法 基于网络结构信息的网络表示方法只考虑网络节点之间的链接关系.给定网络图 G=(V, E).其中V 表示网络中的节点集合:E 是网络中的边集合网络表示学习的目的在于从网络信息中学习得到各个节点的低维表示是向量的维度. 这部分分别介绍 DeepWalk.LINE 和 GraRep三种模型.其中 DeepWalk 是以 Skip-gram 模型为基础,本质上使用了二阶的网络上下文信息:LINE模型显示地提出了网络表示方法的目标函数,考虑了一阶和二阶的上下文信息:

中国人工智能学会通讯——Master虽优势较多 但仍有缺陷

近日,Master 在各大围棋网站横扫顶尖职业棋手,随后,谷歌 DeepMind 创始人德米什 • 哈萨比斯在 Twitter 上发布消息,证实了 Master 是 AlphaGo 的升级版.众所周知,围棋困难的地方在于它的估值函数非常不平滑,差一个子盘面就可能天翻地覆:同时状态空间大,也没有全局的结构.这两点加起来,迫使目前计算机只能用穷举法,并且因此进展缓慢.但人能下得好,能在几百个选择中知道哪几个位置值得考虑,说明它的估值函数是有规律的.这些规律远远不是几条简单公式所能概括,但所需的信息量

《中国人工智能学会通讯》——第1章 从图灵测试到智能信息获取 1.1 图灵测试与问答

第1章 从图灵测试到智能信息获取 随着计算机科学与互联网技术及产业的蓬勃发展,大数据相关的信息智能处理给人类的生活带来了天翻地覆的变化.在这个洪流中,人工智能技术的发展和贡献有目共睹,也同时得到了各大 IT 企业的强烈关注.其中,智能问答越来越受到关注,甚至于被预见为下一代互联网信息服务的基本形式.本文试图从图灵测试开始,探讨理解问答形式本身的性质.发展和未来. 1.1 图灵测试与问答 图灵(Turing),伟大的计算机科学家,1950 年发表了题为<计算机器与智能>的论文,提出了著名的&qu

中国人工智能学会通讯——深蓝、沃森与AlphaGo

在 2016 年 3 月 份,正当李 世石与AlphaGo 进行人机大战的时候,我曾经写过 一 篇< 人 工 智 能 的 里 程 碑: 从 深 蓝 到AlphaGo>,自从 1997 年深蓝战胜卡斯帕罗夫之后,随着计算机硬件水平的提高,计算机象棋(包括国际象棋和中国象棋)水平有了很大的提高,达到了可以战胜人类最高棋手的水平.但是,长期以来,在计算机围棋上进展却十分缓慢,在 2006 年引入了蒙特卡洛树搜索方法之后,也只能达到业余 5 段的水平.所以 AlphaGo 战胜韩国棋手李世石,确实是人

中国人工智能学会通讯——2016机器智能前沿论坛召开

2016 年 12 月 17 日,由中国人工智能学会.中国工程院战略咨询中心主办,今日头条.IEEE<计算科学评论>协办的"2016机器智能前沿论坛"暨"2016 BYTE CUP国际机器学习竞赛颁奖仪式"在中国工程院举办.论坛嘉宾包括中外顶尖的数据挖掘.机器学习,以及自然语言处理方向的专家学者. 与以往不同,本次论坛除介绍机器学习的重大进展和应用外,还着重讨论了机器学习技术在媒体数据上的应用,并为2016 BYTE CUP 国际机器学习竞赛的获奖选手进