《中国人工智能学会通讯》——1.22 如何评价智能问答系统

1.22 如何评价智能问答系统

长期以来,人工智能界乃至计算机界梦寐以求,希望让计算机拥有人类的智能,能够像人类一样进行高度自主的认知、学习、推理。这一梦想推动了过去五六十年来人工智能研究和开发的巨大进步。

如何验证计算机已经具有了“人类”的智能?图灵在 1950 年写了一篇论文《计算机器与智能》,提出了如下的判断原则:测试者在与被试(包括人和机器)隔开的情况下,通过键盘等装置向被试随意提问。经过一段时间,如果测试者不能确认所收到的答复来自人还是机器,那么这台机器就通过了测试,并被认为具有人类智能。类似地,美国认知心理学家 G. M.Ulson 认为,判别计算机理解自然语言的四个标准是问答系统、文摘、复述和机器翻译。计算机只要达到以上标准之一,就认为它理解了自然语言。总而言之,问答是衡量人工智能水平的重要手段,问答系统的性能反映了人工智能系统的水平,因此问答技术的研究开发对于人工智能的发展有重要意义。

另一方面,人们自然而然就能想到,如何衡量智能问答的技术水平?哪些测试指标常用来评价问答系统?如今的智能回答能达到怎样的技术水准?接下来,本文将主要从评测和答题两个角度,对智能问答的评价方法加以介绍。需要说明的是,由于篇幅有限,本文所介绍的评价方法和评测手段将既不覆盖聊天机器人、语音助手和社区问答等系统,也不考虑问答的答题策略、人机交互和情感需求,而是聚焦于问题求解能力,要求对于给定的问题,不管来自开放域还是限定域,都能够直接给出问题的准确答案。

时间: 2024-09-03 20:29:19

《中国人工智能学会通讯》——1.22 如何评价智能问答系统的相关文章

中国人工智能学会通讯——大数据与认知智能

今天的主题是机器学习和人工智能.首先讲机器学习,刚刚铁岩给了很好的介绍.如果用从处理数据集x和目标y的角度对机器学习进行简单分类,可以大致归纳为以下三点:第一,对于Supervised Learning,学习的核心是从x到y的映射.如果目标y是离散的,它就是分类问题,例如人脸识别就是一个机器学习的分类问题:如果这个y是连续变量,那就是回归问题,比如对雾霾的预测就利用了回归的方法.第二,对于Unsupervised Learning,只有一个x,没有y.第三,增强学习处于监督学习和非监督学习之间.

中国人工智能学会通讯——机器人组件技术在智能制造系统中的应用

摘要:随着工业4.0时代的到来,如何将传统工厂改造成为个性化.网络化.柔性生产的智能制造系统成为了当前的研究热点.本文从智能制造系统和智能机器人系统的相似性出发,构建了基于机器人组件技术的智能制造系统,对智能制造系统中各个生产单元进行组件化技术封装,实现了生产组件之间的信息互联和即插即用,通过个性化订单要求对各生产组件在线任务规划,达到柔性生产的目标.此外用多异构机器人模拟各工位生产单位搭建了一个可以根据用户订单生产的小型智能制造实验平台,实验结果验证了本研究构建系统的可行性. 关键词:机器人组

中国人工智能学会通讯——面向知识图谱的自然语言问答系统 1 信息检索式的知识库问答

1 信息检索式的知识库问答 信息检索式的方法通常先确定问题的中心实体,继而生成问题的若干候选答案,再使用打分.排序等方式找出最适合原问题的答案.这类方法的整体框架比较简洁,对于简单问题有较好的效果. 1.1 确定中心实体 信息检索式的方法通常假设问题足够简单,大多数系统认为问题中有且仅有一个实体,这个实体被称作中心实体(Topic Entity),这是用户输入自然语言问题的核心,同时假设问题答案在知识图谱中离中心实体足够近,例如在离中心实体θ步以内(θ通常取2).例如问题"What is the

中国人工智能学会通讯——打造云上视觉智能生态 1.4 视觉智能实例:城市之眼

1.4 视觉智能实例:城市之眼 视觉之眼,是城市的眼睛.我们要处理的是城市的摄像头,不管是交通.安防.城管,还是个人的,这些摄像头的数据,我们思考怎样把它的价值挖掘出来.里面涉及到的技术仍然是视觉数据的检测.识别.系统.搜索.挖掘等. 这个例子是交通视频的分析,对车辆的检测.车辆的跟踪.车辆的属性,就是将路面上发生的事情了解个底朝天.过去做交通优化时有两个信息源,第一个是地感线圈:但线圈数据不知道这个车的属性.车类型.车多长,这个车到哪里去了,这个信息不全.第二个数据,是GPS的数据,但一般只有

中国人工智能学会通讯——着力突破与创新 实现超越与引领

提 要 2016年3月,围棋人机大战的结果,在舆论界激起了惊涛骇浪:在科技界也引起了强烈反响.为了把握人工智能的发展现状和规律,探讨我国人工智能的发展战略,在中国人工智能学会和众多人工智能同行的支持下,由本文作者出面申请了一次高层战略研讨会,这就是以"发展人工智能,引领科技创新"为主题的香山科学会议.与会者同气相求.同心协力,站在国家战略的高度,以纵览全球的视野,通过深入的研讨和论证,凝聚了诸多宝贵的共识,形成了直送中央的<关于加快发展我国人工智能的专家建议>.本文简要介绍

中国人工智能学会通讯——2016机器智能前沿论坛召开

2016 年 12 月 17 日,由中国人工智能学会.中国工程院战略咨询中心主办,今日头条.IEEE<计算科学评论>协办的"2016机器智能前沿论坛"暨"2016 BYTE CUP国际机器学习竞赛颁奖仪式"在中国工程院举办.论坛嘉宾包括中外顶尖的数据挖掘.机器学习,以及自然语言处理方向的专家学者. 与以往不同,本次论坛除介绍机器学习的重大进展和应用外,还着重讨论了机器学习技术在媒体数据上的应用,并为2016 BYTE CUP 国际机器学习竞赛的获奖选手进

中国人工智能学会通讯——机器学习里的贝叶斯基本理论、模型和算法

非常感 谢周老师给这个机会让我跟大家分享一下.我今天想和大家分享的是,在深度学习或者大数据环境下我们怎么去看待相对来说比较传统的一类方法--贝叶斯方法.它是在机器学习和人工智能里比较经典的方法. 类似的报告我之前在CCF ADL讲过,包括去年暑假周老师做学术主任在广州有过一次报告,大家如果想看相关的工作,我们写了一篇文章,正好我今天讲的大部分思想在这个文章里面有一个更系统的讲述,大家可以下去找这篇文章读. 这次分享主要包括三个部分: 第一部分:基本理论.模型和算法 贝叶斯方法基础 正则化贝叶斯推

中国人工智能学会通讯——无智能,不驾驶——面向未来的智能驾驶时代 ( 下 )

到目前为止似乎比较完美,而实际还 存在着一些问题.我们现在看到很多道 路上面,交通标志牌它的分布非常稀疏, 可能每过一两公里才能够检测出来一个 交通标志牌,因为毕竟这个深度学习算 法是目前最完美的,它有时候还会错过 一个交通标志牌,这时候怎么办呢?我 们会发现在路面上也有非常明显的视觉 特征,我只要把路面的这些视觉特征识 别出来进行匹配,其实是有连续的绝对 的视觉参考的.所以我们做的办法是, 把这个路面粘贴起来.这个粘贴的方法 很简单,跟我们手机拍场景图片一样, 我们慢慢移动的时候可以把这个场景

中国人工智能学会通讯——深蓝、沃森与AlphaGo

在 2016 年 3 月 份,正当李 世石与AlphaGo 进行人机大战的时候,我曾经写过 一 篇< 人 工 智 能 的 里 程 碑: 从 深 蓝 到AlphaGo>,自从 1997 年深蓝战胜卡斯帕罗夫之后,随着计算机硬件水平的提高,计算机象棋(包括国际象棋和中国象棋)水平有了很大的提高,达到了可以战胜人类最高棋手的水平.但是,长期以来,在计算机围棋上进展却十分缓慢,在 2006 年引入了蒙特卡洛树搜索方法之后,也只能达到业余 5 段的水平.所以 AlphaGo 战胜韩国棋手李世石,确实是人