《中国人工智能学会通讯》——7.2 基于深度学习的自然语言处理

7.2 基于深度学习的自然语言处理

深度学习旨在模拟人脑对事物的认知过程,一般是指建立在含有多层非线性变换的神经网络结构之上,对数据的表示进行抽象和学习的一系列机器学习算法。该方法已对语音识别、图像处理等领域的进步起到了极大的推动作用,同时也引起了自然语言处理领域学者的广泛关注。

如图 1 所示,深度学习为自然语言处理的研究主要带来了两方面的变化,一方面是使用统一的分布式(低维、稠密、连续)向量表示不同粒度的语言单元,如词、短语、句子和篇章等;另一方面是使用循环、卷积、递归等神经网络模型对不同的语言单元向量进行组合,获得更大语言单元的表示。除了不同粒度的单语语言单元外,不同种类的语言,甚至不同模态(语言、图像等)的数据都可以通过类似的组合方式,表示在相同的语义向量空间中;然后通过在向量空间中的运算来实现分类、推理、生成等各种能力,并应用于各种相关的任务之中。下面分别对这两方面加以详细的阐述。

时间: 2024-12-27 19:06:21

《中国人工智能学会通讯》——7.2 基于深度学习的自然语言处理的相关文章

《中国人工智能学会通讯》——1.31 深度学习 在自然语言处理研究上的进展

1.31 深度学习 在自然语言处理研究上的进展 近年来,深度学习在人工智能的多个子领域都取得了显著的进展.在自然语言处理领域,虽然深度学习方法也收到越来越多的关注,在很多任务上也取得了一定效果,但是并没有其他领域那么显著.传统的主流自然语言处理方法是基于统计机器学习的方法,所使用的特征大多数是基于 onehot 向量表示的各种组合特征.这个特征表示方式会导致特征空间非常大,但也带来一个优点.就是在非常高维的特征空间中,很多任务上都是近似线性可分的.因此,在很多任务上,使用线性分类器就是可以取得比

《中国人工智能学会通讯》——6.3 深度学习的基础模型

6.3 深度学习的基础模型 深度学习(Deep Learning)源于人工神经网络(简称神经网络),其初衷是从仿生学角度建立模拟人脑学习的神经元网络结构,从而模仿人脑的机制来解释数据.早期的神经网络是浅层神经网络,通常仅含有单个输入层.少量隐藏层和单个输出层,输入通常是人工提取的特征.其连接方式是,从输入层开始到输出层结束,中间各层接收前一级输入,并输入到下一级,整个网络中无反馈,因而又称为前馈网络.而深度学习的模型是深度神经网络,较之浅层神经网络,它具有较多的隐藏层和复杂的连接方式,因而能够自

《中国人工智能学会通讯》——7.13 深度学习与分布式表示学习概览

7.13 深度学习与分布式表示学习概览 深度学习的概念源于人工神经网络的研究.深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的有效表示,而这种使用相对较短.稠密的向量表示叫做分布式特征表示(也可以称为嵌入式表示).本部分主要对于目前使用较广的一些学习算法进行一个简单的回顾. 首先介绍一些浅层的分布式表示模型.目前在文本领域,浅层分布式表示模型得到了广泛的使用,例如 word2vec.GloVec 等[6] .与传统词袋模型对比,词嵌入模型可以将词或者其他信息单元(例如短

《中国人工智能学会通讯》——1.40 深度学习

1.40 深度学习 罗曼·扬波利斯基是路易斯维尔大学网络安全实验室主任.他认为,2016 年,我们将看到卷积神经网络(深度学习)领域的迅速发展,超级计算机的使用将使这个领域成为 2016 年人工智能发展的重点. 浅层学习是机器学习的第一次浪潮,主要是计算机系统从大量训练样本中学习统计规律,对未知事件做预测,实际上这种人工神经网络只是一种浅层模型. 深度学习是指通过构建多层的机器学习模型和海量训练数据来学习更有用的特征,目的在于建立.模拟人脑进行学习的神经网络,模仿人脑来解释数据,深度学习是无监督

《中国人工智能学会通讯》——7.11 深度学习在推荐算法上的应用进展

7.11 深度学习在推荐算法上的应用进展 最近几年是深度学习发展的黄金时间,其在多个领域取得了重要进展,包括图像领域.语音领域.文本领域等.深度学习为科研工作者提供了一种非常有效的技术途径,其本质上是对数据特征进行深层次的抽象挖掘,通过大规模数据来学习有效的特征表示以及复杂映射机制,从而建立有效的数据模型.从方法上来说,深度学习具有的优点本质上是领域无关的.因此,在可预见的未来,深度学习将会作为一种较为通用的数据建模方法,对于多个潜在领域的应用产生重要影响. 在信息大数据时代,用户的个性化需求不

《中国人工智能学会通讯》——2.18 深度学习算法的计算与访存特征

2.18 深度学习算法的计算与访存特征 图 1 是一个用于手写识别的深度卷积神经元网络 LeNet5 [6] ,以此为例讨论深度学习算法的计算特征.在 LeNet5 中,包括了卷积层 C1.C3.C5 和Subsampling 层 S2.S4,以及全连接层 F6.其中卷积层是最为费时的操作. 对 于 有 R 个 输 入 feature map 和 Q 个 输 出feature map 的卷积层,假设 feature map 的大小为 M×N,卷积核的大小为 K×L,则该卷积层的代码大致可以表示为

《中国人工智能学会通讯》——11.30 深度迁移学习

11.30 深度迁移学习 随着互联网技术在各个领域的广泛应用,特别是社会网络,以及移动计算的崛起,文本.图像.视频等非结构化数据呈现出指数式增长,迫切需要有效的数据分析方法和高效的数据处理算法.机器学习作为大数据智能化分析的主要技术基石,在理论和实践两方面都取得了飞速进展,特别是在深度学习[1]上取得了革命性突破. 虽然人们已经能够通过信息系统.社会媒体.移动计算.工业互联网等渠道收集到大规模.多模态.高维度.快速变化的大数据,但大数据中高价值的标记数据还是比较稀缺的.从监督机器学习的视角来看,

中国人工智能学会通讯——从大数据到大知识——自然语言处理领域的投资机会

今天我报告的题目是<从大数据到大知识--自然语言处理领域的投资机会>.其实搞投资也是挺苦的事,我最近才开始学习,投资的活很专业,没有常人想象的那么风光.我今天讲的题目有四个方面,第一是对AI时代的看法:第二,NLP是AI皇冠上的明珠:第三,我们的AI之路及ABC融合的想法:第四,NLP领域的投资方向. 前面的不用讲了,我们不太愿意谈人工智能,但是不得不谈,因为大家都在谈.包括我们开复同学,前不久搞了一篇很高点击量的自媒体文章<我不是李开复,我是人工智能>.从投资的方向上来看,201

《中国人工智能学会通讯》——11.77 特征学习模型在天文光谱识别中的 应用

11.77 特征学习模型在天文光谱识别中的 应用 随着新一代巡天观测.时域观测等天文项目的推进,当前的天文数据以"雪崩"之势增长[18] ,由此导致了天文数据自动挖掘方法研究的必要性和迫切性.国际上,近年来大规模图像巡天和大样本光谱巡天方面已经取得了长足的进展[19] ,特别是一系列光谱巡天计划的成功实施,使人们获得了空前丰富的恒星光谱资料,推动了天文学各个分支的蓬勃发展.恒星光谱,无论是连续谱还是线谱,差异极大.恒星光谱主要取决于恒星的物理性质和化学组成.因此,恒星光谱类型的差异反映

《中国人工智能学会通讯》——9.10 集成学习的动机和优势

9.10 集成学习的动机和优势 与单一的学习模型相比,集成学习模型的优势在于能够把多个单一学习模型有机地结合起来,获得一个统一的集成学习模型,从而获得更准确.稳定和强壮的结果.在美国 NETFLIX 电影推荐比赛中,基于集成学习的推荐算法获得了第一名.在多次 KDD 和 ICDM 的数据挖掘竞赛中,基于集成学习的算法都取得了最好的成绩.集成学习算法已成功应用于智能交通中的行人检测.车辆检测等,图像和视频处理中动作检测.人物追踪.物体识别等,生物信息学蛋白质磷酸化位点预测.基因组功能预测.癌症预测