《中国人工智能学会通讯》——7.10 总结和展望

7.10 总结和展望

机器阅读理解是自然语言处理的一个子任务,回答这一类的问题需要对文本的深层次含义进行理解建模。该任务属于高级别抽象的认知任务,传统方法还是依靠一些特征工程的手段去对文本语义的一部分做出归纳。深度学习技术在这个领域虽然也有一些工作提出,但是由于受到训练集大小的限制,现阶段取得的成果并不具备优势。就目前的研究成果来看,机器阅读理解的研究未来有三方面值得关注。

第一,首先从统计的角度分析,现有针对问答系统的深度学习技术(如记忆网络、神经图灵机、关注模型)都是需要大量数据才能很好的训练的,如果把阅读理解过程当成一个非常复杂的函数,这个函数实现从文本(函数自变量)到知识(函数因变量)的映射,由于映射过程复杂,值域定义域非常之大,所以想通过数据对这个函数进行拟合(深度神经网络的训练过程),则需要大量数据才能完成。而由于阅读理解包含高度抽象的推理过程,相对于低抽象(语言模型等)过程数据自动获取难度较大,因而人工构造一些庞大的数据集,又非常困难。但是,现有的其他自然语言处理资源很多(如知识库、情感分析数据集、关系分类数据集等),每一部分都包括了不同的语言学现象,如何利用现有的含有不同语义特征的语言学资源来帮助完成阅读理解任务,使现有的神经网络方法能够很好的展现其能力,是未来阅读理解研究的一个重要方向。

第二,从逻辑的角度来看,对过程进行建模如果从统计的角度则需要大数据,而通过逻辑的角度则是一条条规则。现有基于 Lamada 表达式和一阶谓词逻辑的 semantic parsing 方法展现出了很强的推理能力。但是这些规则的构造非常困难,而且领域适应性太差。如何依靠数据对规则进行建模是一个非常期待的研究方向。现在的马尔可夫逻辑网,概率软逻辑在这一方面展现了很好的性能,但是由于这些工作的基本单元还是符号规则,因而应用性还是不高。如何将最基本的规则单元从符号转换到连续数值空间,使之有更强的鲁棒性和数据驱动性则是一个亟待解决的问题。虽然现有一些方法能够将逻辑规则单元转化成张量表达,但是由于对张量的不同操作(内积、外积)等和实际的逻辑操作(析取、合取、并)等有所差别,所以在这一方面推进还很有挑战。

第三,现有的深度学习方法往往着重于句子整体的语义(因而叫做黑盒模型),实行端对端的训练,这样的方式虽然简单,但是可解释性太差,内部机制(除去统计角度)还难以理解。那么,我们是不是可以把阅读理解“推理”任务拆分开来,把整个文本理解过程当作很多更为细粒度的语义分析过程的集合,然后对每一个子部分进行建模。最后将这些子过程有机(同步、异步、时间先后)结合在一起,组成最后的理解过程,是不是会有更好的效果和更好的解释性。并且依靠深度学习技术,建模过程会相对简单,这一问题还有待研究。

本文对于机器阅读理解任务,以及目前的一些代表性的方法进行了简要综述。随着近些年来人工智能的发展,人们不仅仅满足于计算机能够帮助我们实现计算、统计,还希望计算机能够帮助我们实现推理;不仅仅希望计算机能够“听”我们,更希望它们能够“懂”我们。近一段时间,大型互联网公司都着重在人工智能上加大力度投入研究,Facebook 成立了人工智能实验室,谷歌研制的阿尔法狗也战胜了人类围棋冠军。机器阅读理解虽然现阶段属于自然语言处理的一个子任务,但是它却是机器人工智能的一个很好的体现。回答选择题是表象,理解文本是内在。相信随着越来越多研究人员投入到自然语言理解领域,机器阅读理解也将迎来更大的发展。

时间: 2024-09-24 10:23:03

《中国人工智能学会通讯》——7.10 总结和展望的相关文章

《中国人工智能学会通讯》——10.17 复杂网络化系统安全控制研究综述

10.17 复杂网络化系统安全控制研究综述 复杂网络化系统是传统工业控制系统向互联网开放过程中与先进通信和计算技术相结合的产物.基于各类网络通信技术,复杂网络化系统能巧妙地将在物理层面上独立分布的控制和计算单元在信息层面上紧密融合,从而在不受地域和环境限制的情况下对大规模的信息进行收集和处理,为系统最终的控制决策提供支撑.典型的复杂网络化系统包括智能电网.智慧医疗和智慧交通系统等,它们往往工作在国民经济的关键领域,为国家现代化工业生产和人民生活的顺利进行提供保证[1-2] .图 1 给出了一个以

《中国人工智能学会通讯》——10.20 潜在研究方向

10.20 潜在研究方向 根据第 3 节的分析可知,阻碍复杂网络化系统安全控制研究进一步突破的障碍主要来自于复杂网络化系统自身的问题和网络攻击建模的困难性.基于此,将来的研究重点将会围绕如何解决这些挑战性问题展开,可能的研究方向包括: (1)在系统架构分析与建模方面:需要在综合考虑计算.通信与控制多时空关联的情况下对复杂网络化系统进行建模并分析其安全约束. (2)在攻击检测方面:需考虑复杂网络化系统自身的特征,包括边界模糊.设备异构,以及计算.通信与控制 3C 耦合等,同时考虑网络攻击建模难的问

《中国人工智能学会通讯》——10.15 系统实施

10.15 系统实施 所实施的"智能电网监测终端无线供电装置"WPT 系统如图 7 所示,主要分为高压取电部分.高频逆变部分.耦合谐振部分和整流稳压及负载部分 5 个部分. 工作性能如表 2 所示,能够在线路负荷电流 200 A 时为低压侧设备提供不少于 20 W 的电能. 图 7 中,高压取电装置从模拟大电流线路中获得工频交流电能,其额定输出功率为 200 A/100 W.高压取电装置输出的工频交流电能经过整流稳压处理后以 48 V 的直流电能为高频逆变部分供电. 高频逆变部分如图

《中国人工智能学会通讯》——10.18 研究进展

10.18 研究进展 本节将就复杂网络化系统安全控制研究的最新进展展开综述,主要涉及系统的安全架构分析与建模.攻击检测与安全评估,以及安全控制等诸方面.通过综述,将对国内外相关领域的主要工作分别进行总结,并分析存在的不足. 1 . 系统架构分析与建模 围绕复杂网络化系统的构架分析与建模,国内外学者开展了一系列研究工作.一方面,主要侧重于通信网络与物理系统在统一描述框架下的时空分析.实时性与稳定性等.例如文献 [11-20] 分别考虑网络通信因素(包括数据传输时滞.丢包.数据量化.干扰.带宽受限等

《中国人工智能学会通讯》——10.4 智慧微能源网(群)能量管理

10.4 智慧微能源网(群)能量管理 智能微电网能量管理的主要目标为实现多指标自趋优运行[1] .智能微电网能量管理主要采用分层控制体系[10-11] ,分层控制可以实现传统智能电网分散控制和集中控制之间的有效折衷.智能微电网(群)能量管理可为智慧微能源网(群)的能量管理提供技术支撑[26] . 智慧微能源网的核心环节也是能量路由器,微能源网的智慧运行依赖于能量路由器的高效能量管理.智慧微能源网亦可采用分层控制架构,第一层实现多能源生产单元及输出产品的控制:第二层实现能量路由器的控制:第三层实现

《中国人工智能学会通讯》——10.5 智慧微能源网(群)多指标自趋优 运行

10.5 智慧微能源网(群)多指标自趋优 运行 如前所述,智慧微能源网(群)是否"智慧",取决于其是否能够实现多指标自趋优运行[1] .本节采用工程博弈论这一理论,并结合智慧微电网(群)的特点,提出基于分布自治.集中协调的优化调度体系,进而实现智慧微能源网(群)的多指标自趋优运行,所建立的决策博弈模型如图 7 所示. 图 7 中分布自治环节的主要作用是实现微能源网间分布决策以及网内单元自治.网间分布决策由不同能源网能量路由器的控制实现,即由智慧微能源网分层能量管理体系中的第二层及嵌入的

《中国人工智能学会通讯》——10.29 实验结果

10.29 实验结果 我 们 在 Multi-PIE 数 据 集[7] .SurveillanceCameras 人脸数据集[8] .Multiple Biometric GrandChallenge 数据集[9]以及 Chock Point 数据集[10]上做了大量的实验来验证我们方法的适用性.我们使用了免费公开的基于主动形状模型(ASM)的 C++软件库.STASM [26] ,自动地去检测特征点位置 ; 然后手动纠正那些不正确的位置.注意,所检测到的位置只在训练过程中才需要.在测试过程中,

《中国人工智能学会通讯》——10.9 狭义能源互联网系统结构及其特点

10.9 狭义能源互联网系统结构及其特点 综合目前现代能源互联网的研究状况,从大区域能源资源配置.多种能源互联结构和功能实现三个角度分为全球能源互联网.广义能源互联网和狭义能源互联网.全球能源互联网由跨洲.跨国骨干网架和各国各电压等级电网构成,连接"一极一道"大型能源基地,适应各种集中式.分布式电源,能够将风能.太阳能.海洋能等可再生能源输送到各类用户.广义能源互联网是将一个广泛区域内分散的能源碎片集聚形成一个扁平化结构的超级能源体,它将人类所使用的分散于不同地区的各种能源资源及信息资

《中国人工智能学会通讯》——10.23 能源互联网中的关键技术

10.23 能源互联网中的关键技术 现阶段可再生能源供应有很强的随机性.间断性和模糊性,成功并入电网并用其他形式高效利用存在很多技术上的难题:其次,对于能源互联网的建立,不仅要解决能源的高成本传输,以及能量输送损耗问题,还要对于能源互联网中产生的大数据进行实时处理,来预测和监控用户的需求变化,以及极端不稳定的能量生产供应变化.要解决上述问题并实现具体功能,能源互联网需要相应的技术体支撑.笔者认为,能源互联网的关键技术可以分为四个子技术,即体系架构技术.能源技术.信息通信技术和安全技术. 体系架构

《中国人工智能学会通讯》——10.22 能源互联网时代

10.22 能源互联网时代 根据美国能源信息管理局(EIA)最新公布的数据,截止到 2015 年 7 月,美国的当年能量消耗达到 57.782 万亿 BTU,其中化石燃料的消耗量为47.109 万亿 BTU,占总数的 81.529%.自第二次工业革命到现在,由于能源消费结构对化石燃料的依赖,产生了两个主要问题:① 能源短缺可能会成为一个重大危机:② 由于温室气体的排放,如从化石燃料燃烧的二氧化碳,全球变暖将持续恶化.应对这些日益严重的问题,如何更好地利用可再生能源显得迫切重要.目前,可再生能源的