中国人工智能学会通讯——自然语言处理的十个发展趋势 趋势 1: 语义表示——从符号表示到分布表示

趋势 1: 语义表示——从符号表示到分布表示

自然语言处理一直以来都是比较抽象的,都是直接用词汇和符号来表达概念。但是使用符号存在一个问题,比如两个词,它们的词性相近但词形不匹配,计算机内部就会认为它们是两个词。举个例子,荷兰和苏格兰这两个国家名,如果我们在一个语义的空间里,用词汇与词汇组合的方法,把它表示为连续、低维、稠密的向量,就可以计算不同层次的语言单元之间的相似度。这种方法同时也可以被神经网络直接使用,是这个领域的一个重要的变化。

从词汇间的组合,到短语、句子,一直到篇章,现在有很多人在做这个事,这和以前的思路是完全不一样的。

有了这种方法之后,再用深度学习,就带来了一个很大的转变。原来我们认为自然语言处理要分成几个层次,但是就句法分析来说,它是人为定义的层次,那它是不是一定必要的?这里应该打一个问号。

实际工作中,我们面临着一个课题——信息抽取。我之前和一个单位合作,初衷是做句法分析,然后他们在我的基础上做信息抽取,相互配合,后来他们发表了一篇论文,与初衷是相悖的,它证明了没有句法分析,也可以直接做端到端的直接的实体关系抽取,

这很震撼,不是说现在句法分析没用了,而是我们认为句法分析是人为定义的层次,在端到端的数据量非常充分,可以直接进行信息抽取时,不用句法分析,也能达到类似的效果。当端到端的数据不充分时,才需要人为划分层次。

时间: 2024-08-29 07:20:34

中国人工智能学会通讯——自然语言处理的十个发展趋势 趋势 1: 语义表示——从符号表示到分布表示的相关文章

《中国人工智能学会通讯》——6.22 挑战与趋势

6.22 挑战与趋势 正如前文所述,现在的情感分析工作已经能够完成一些简单的任务,在上述任务上都表现出机器具有识别人类情感的能力,但也面临许多挑战. ● 在情感研究对象上,随着应用领域的不断扩展,情感对象从之前的对产品.服务等的褒贬倾向性评论到对社交媒体中的用户.话题情绪分类,表现形式更加多样,情感种类更加繁多,研究的内容也会发生相应转变,包括更加关注用户的信息以及针对社交媒体中事件用户情感的变迁. ● 在情感表达形式上,人们对于情感的表达也多样化的,有直截了当的,也有含蓄不露的,更有通过修辞手

《中国人工智能学会通讯》——5.3 未来发展趋势

5.3 未来发展趋势 航空高端装备智能制造技术作为航空高端制造的核心技术,其涉及的高端装备制造是解决瓶颈问题的技术基础,是发展实体经济,实现制造强国的物质基础:是国民经济的支柱性产业,对于实施制造强国发展战略,实现由制造大国向制造强国转变具有重大战略意义. 飞机数字化智能制造技术 飞机装配过程是将大量的飞机零件按数模.技术要求等进行组合连接,实现从零件到组件到段件,最终到部件的过程.目前,国外先进国家的航空制造技术中,数字化装配正在取代传统制造技术,是未来飞机装配的发展趋势.在飞机数字化智能制造

《中国人工智能学会通讯》——8.33 未来发展趋势

8.33 未来发展趋势 尽管并行与分布式进化算法已经受到了大量学者的关注,而且大量有代表性的算法也被提出并用于求解一些实际问题.然而随着科学技术的发展,大数据时代的到来,一些新的挑战充斥着人们的生活,特别是一些高复杂度.大数据量.实时性优化问题变得越来越常见并迫切需要解决.本文从以下几个方面阐述并行与分布式进化算法的未来发展趋势. 并行与分布式进化算法处理实时性应用问题 随着云计算平台和高性能平台(比如连续蝉联世界超级计算机冠军的天河二号)的出现,大量的并行与分布式计算任务提交到平台系统.由于这

《中国人工智能学会通讯》——7.28 利用 PrAGMATiC 算法构建语义地 图集

7.28 利用 PrAGMATiC 算法构建语义地 图集 鉴于在不同的被试上,语义系统区域的语义选择性分布模式有很强的一致性,我们希望建立一个人类大脑皮层上的地图集来描述语义选择性功能区域的分布.为了实现这一目标,设计了一种新的贝叶斯算法 PrAGMATiC 来获得覆盖大脑皮层区域的概率生成模型.这个算法为体元精度下模拟的致密层叠的大脑功能同源区域地图的功能调谐模式建立了模型,同时考虑到了不同被试间大脑解剖结构和功能构造上的差异.不同功能区域的组织和选择性由使用 fMRI 数据通过类似对比散度

《中国人工智能学会通讯》——12.8 序列模式挖掘趋势展望

12.8 序列模式挖掘趋势展望 近年来,数据挖掘会议和期刊中将模式与统计结合成为较热门的研究方向[47-49] ,通过统计方法对数据模式进行剪枝.判断模式的"有趣性"成为热点.例如,Nakagawa 等人[50]提出基于统计的安全剪枝规则对数据模式进行剪枝:Tatti [47] 提出的基于概率的划分模型 , 可以根据所预测的"有趣性"对无间隔的频繁情景模式进行排序.此外,在数据库会议和期刊中,面向大规模数据的具有高可扩展能力的序列模式挖掘算法也不断发表[33,51]

中国人工智能学会通讯——深蓝、沃森与AlphaGo

在 2016 年 3 月 份,正当李 世石与AlphaGo 进行人机大战的时候,我曾经写过 一 篇< 人 工 智 能 的 里 程 碑: 从 深 蓝 到AlphaGo>,自从 1997 年深蓝战胜卡斯帕罗夫之后,随着计算机硬件水平的提高,计算机象棋(包括国际象棋和中国象棋)水平有了很大的提高,达到了可以战胜人类最高棋手的水平.但是,长期以来,在计算机围棋上进展却十分缓慢,在 2006 年引入了蒙特卡洛树搜索方法之后,也只能达到业余 5 段的水平.所以 AlphaGo 战胜韩国棋手李世石,确实是人

中国人工智能学会通讯——2016机器智能前沿论坛召开

2016 年 12 月 17 日,由中国人工智能学会.中国工程院战略咨询中心主办,今日头条.IEEE<计算科学评论>协办的"2016机器智能前沿论坛"暨"2016 BYTE CUP国际机器学习竞赛颁奖仪式"在中国工程院举办.论坛嘉宾包括中外顶尖的数据挖掘.机器学习,以及自然语言处理方向的专家学者. 与以往不同,本次论坛除介绍机器学习的重大进展和应用外,还着重讨论了机器学习技术在媒体数据上的应用,并为2016 BYTE CUP 国际机器学习竞赛的获奖选手进

中国人工智能学会通讯——机器学习里的贝叶斯基本理论、模型和算法

非常感 谢周老师给这个机会让我跟大家分享一下.我今天想和大家分享的是,在深度学习或者大数据环境下我们怎么去看待相对来说比较传统的一类方法--贝叶斯方法.它是在机器学习和人工智能里比较经典的方法. 类似的报告我之前在CCF ADL讲过,包括去年暑假周老师做学术主任在广州有过一次报告,大家如果想看相关的工作,我们写了一篇文章,正好我今天讲的大部分思想在这个文章里面有一个更系统的讲述,大家可以下去找这篇文章读. 这次分享主要包括三个部分: 第一部分:基本理论.模型和算法 贝叶斯方法基础 正则化贝叶斯推

中国人工智能学会通讯——无智能,不驾驶——面向未来的智能驾驶时代 ( 下 )

到目前为止似乎比较完美,而实际还 存在着一些问题.我们现在看到很多道 路上面,交通标志牌它的分布非常稀疏, 可能每过一两公里才能够检测出来一个 交通标志牌,因为毕竟这个深度学习算 法是目前最完美的,它有时候还会错过 一个交通标志牌,这时候怎么办呢?我 们会发现在路面上也有非常明显的视觉 特征,我只要把路面的这些视觉特征识 别出来进行匹配,其实是有连续的绝对 的视觉参考的.所以我们做的办法是, 把这个路面粘贴起来.这个粘贴的方法 很简单,跟我们手机拍场景图片一样, 我们慢慢移动的时候可以把这个场景