《中国人工智能学会通讯》——6.3 深度学习的基础模型

6.3 深度学习的基础模型

深度学习(Deep Learning)源于人工神经网络(简称神经网络),其初衷是从仿生学角度建立模拟人脑学习的神经元网络结构,从而模仿人脑的机制来解释数据。早期的神经网络是浅层神经网络,通常仅含有单个输入层、少量隐藏层和单个输出层,输入通常是人工提取的特征。其连接方式是,从输入层开始到输出层结束,中间各层接收前一级输入,并输入到下一级,整个网络中无反馈,因而又称为前馈网络。而深度学习的模型是深度神经网络,较之浅层神经网络,它具有较多的隐藏层和复杂的连接方式,因而能够自动的学习特征。

近年来,随着计算资源的不断扩充和机器学习研究的不断深入,深度学习取得了长足的发展,大大推进了人工智能的代表性应用(如图像处理、语音处理和自然语言处理等)的进步,从而激起了学术界和产业界的研究热情和浓厚兴趣,得到了广泛关注。围绕知识图谱的自动创建,当前的相关研究主要聚焦于如何利用基于深度神经网络的自然语言模型对大量文本语料进行分析,并从中抽取知识。从模型结构的角度,当前常用的自然语言模型可归纳为四种,即基于 N-Gram 的前馈神经网络模型、基于递归神经网络的模型、基于卷积神经网络的模型和基于循环神经网络的模型。

基于 N-Gram 的前馈神经网络模型通过学习自然语言的 N-Gram 概率模型,以支持词的分布式特征表示求取等任务。早期的代表性模型如 Bengio等人的神经概率语言模型(NNLM) [8] ,它基于三层的前馈神经网络利用自然语言语句中的前 N-1 个词来预测后第 N 个词,取得了优于当时的 tri-gram模型的结果。其后续拓展模型为基于对数双线性的层级神经网络模型(HLBL) [9] 。在此思路的基础上,Mikolov et al [10] 提出了 CBOW 和 Skip-Gram 模型,前者采用等量的上文和下文信息来预测中间位置的词,后者则采用中间位置的词来预测等量的上文和下文中的词。该方法学习出的 word2vec 词向量表示得到了学术界和产业界的广泛认可。在此基础上,Mikolov 将词序列所在的段落添加为输入,学习出句子或段落的语义表示(paragraph vector) [11] 。相较于其他的深度神经网络模型,基于 N-Gram 的前馈神经网络模型所包含的网络层次较少,能够运用自然语言的上下文共现信息较快完成词句的表示学习。

基于递归神经网络(RNNs, Recursive NeuralNetworks)的模型由 Socher 在 2010 年提出[12] ,其基本理念是将自然语言相对应的层次化树型结构作为对语言建模的主要依据。递归神经网络一般以自然语言语句语法解析所得的树形结构为基础,以叶节点的表示作为输入,通过自底向上的递归运算,计算出非叶子节点的表示。最早用于词句表示学习的递归神经网络是基于二叉语法树的递归自动编码机[13] ,其后陆续拓展出基于矩阵和向量联合表示的模型[14] 、基于张量的模型 [15]和基于依存树的递归神经网络模型[16] 等。该类模型在自然语言转述检测、情感分析、关系分类、图像文本的双向匹配等任务中取得了良好的结果。

基 于 卷 积 神 经 网 络(CNNs,ConvolutionalNeural Networks)的模型,源于用于图像处理的卷积神经网络,经典模型是由 LeCun et al [17] 在上世纪 90 年代提出的 LeNet-5,曾成功应用于手写数字识别。Collobert et al [18] 最早将卷积神经网络应用于词的表示学习和基于词序列的自然语言处理任务。以此为基础,多项研究工作将卷积神经网络应用于基于单个句子和多个句子的自然语言处理任务[19-20] 。基于卷积神经网络的词句表示学习通常不采用语法解析信息,而直接对句子对应的词向量矩阵进行类似于图像处理的卷积操作,以提取局部上下文的特征表示。该模型在情感分析、转述检测、回复匹配等任务中均有良好的表现。

基 于 循 环 神 经 网 络(RNNs,RecurrentNeural Networks)的模型,基于瑞士人工智能实验室 Schmidhuber [21] 在上世纪 80 年代提出的循环神经网络构建,通过带时序参数的网络结构来记录序列数据的上下文信息。循环神经网络具有一组隐藏节点,用于表示系统某一时刻的状态,而系统下一时刻的状态,根据下一时刻的输入和上一时刻的状态决定。由于在反向传播的过程中,梯度传播的线性过程在依赖路径太长的境况下,会出现梯度趋于 0 的问题,因此人们提出在神经元中添加存储单元和门控单元形成基于 LSTM(Long Short TermMemory) [22] 和 GRU(Gated Recurrent Unit) [23]的循环神经网络,以应对上述问题。在自然语言处理中,基于循环神经网络的模型常被应用于单序列任务,如词性标注等。近年来,它被应用于从序列到序列的转换任务中[24] ,而且结合近年来提出的焦点(Attention)机制[25] ,基于循环神经网络的模型在机器翻译、自动对话等领域都取得了令人瞩目的应用成果。

在上述四种网络模型的基础上,研究者还尝试结合不同模型的特点,提出混合模型来提升实验结果。Mou et al [26] 将卷积和递归神经网络结合,提出了树卷积神经网络模型,应用于情感分析、程序分类等任务。Zhang et al [27] 基于自顶向下生成依存树的思路,结合树形结构中的依存路径,提出四种基于 LSTM 的局部循环神经网络来学习概率语言模型,并在多个语言模型评测集上获得了良好的效果。

时间: 2024-09-19 04:36:24

《中国人工智能学会通讯》——6.3 深度学习的基础模型的相关文章

中国人工智能学会通讯——AI如何深度应用于消费金融的风控决策 1.5 最后,无监督学习可以很好补充基于规则的反欺诈场景。

1.5 最后,无监督学习可以很好补充基于规则的反欺诈场景. 虽然欺诈方式一直在变,但好客户的特征并不会发生剧烈变化.所以,通过识别和好客户不一样的用户特征,更加容易发现欺诈.比如同一家门店,连续来了5个客户,都不是当地人,但身份证前6位都一样,就不满足正常的统计分布规律,出现了异常情况.通过聚类.异常检测等无监督学习算法,可以及时发现未知的异常,及时进行干预. 利用强大的计算能力作支撑,通过海量数据的收集处理,以及不断提升机器学习算法,秦苍科技的人工智能正在不断帮助提升风险决策,迎接当前消费金融

《中国人工智能学会通讯》——9.25 搜索引擎点击模型综述

9.25 搜索引擎点击模型综述 在这个信息爆炸的时代,搜索引擎已成为人们在互联网的数据海洋中遨游不可或缺的工具.无论是查找信息.获取资源,还是寻求帮助.发现机遇,都离不开搜索引擎的指引与参考.可以说,搜索引擎已经成为了互联网中的"基础设施".根据中国互联网络中心(CNNIC)发布的中国互联网络发展状况统计报告显示,截止 2016 年 1 月 , 已有82.3% 的互联网用户使用搜索引擎 , 在互联网网络应用中排名第二 ; 而在移动端也有 77.1% 的用户使用移动端搜索引擎 , 在移动

中国人工智能学会通讯——意识科学研究进展 1.2 意识模型的构建

1.2 意识模型的构建 如果意识是物质的,是遵守物理定律 的,那也应该是数学可描述的:需要对意 识建立数学模型加以描述. 意识的数学模型应该满足:① 描述意 识的本质特征.② 符合哲学.科学.常识 对意识的共同定义或理解.③ 能够解释意 识的基本规律,并使得意识的各种规律特 别是这些规律的数学描述能够符合这一模 型:即这一模型应该有很好的可扩展性, 使得复杂的意识现象可能产生的各种数学 描述都能够融合这一(本质特征描述)模型: 任何的意识现象的数学表达都应该作为意 识模型的局部或组件,或处于该模

中国人工智能学会通讯——深度学习与视觉计算 1.3 计算机视觉领域利用深度学习可能带来的未来研究方向

1.3 计算机视觉领域利用深度学习可能带来的未来研究方向 第一个,深度图像分析.目前基于深度 学习的图像算法在实验数据库上效果还是 不错的,但是远远不能够满足实际大规模 应用需求,需要进一步的提升算法性能从 而能够转化相应的实际应用.比如这个基 于图片的应用,可以估计性别和年龄,但 是其实经常会犯错,因此需要进一步提升 深度图像分析的性能. 第二个,深度视频分析.视频分析牵扯 到大量的数据和计算量,所以做起来更加 麻烦.当前深度视频分析还处于起步的阶 段,然而视频应用非常广泛,比如人机交互. 智

中国人工智能学会通讯——后深度学习时代的人工智能

1956 年,在美国达特茅斯学院举行的一次会议上,"人工智能"的研究领域正式确立.60 年后的今天,人工智能的发展正进入前所未有的大好时期.我今天作的报告,将通过分析时代的特点,这个时代下人工智能与计算机的可能命运,来重新认识人工智能.认识我们赖以生存的计算机,还有我们自己. 后深度学习时代的前提 我们看到如今人工智能的春天又来了,不过和 30 年前日本兴起的人工智能热潮相比,发生了如下变化:时间不同.地点不同.主题也不同.这次人工智能的大发展与深度学习紧密相关,体现在:① 从知识情报

中国人工智能学会通讯——机器学习里的贝叶斯基本理论、模型和算法

非常感 谢周老师给这个机会让我跟大家分享一下.我今天想和大家分享的是,在深度学习或者大数据环境下我们怎么去看待相对来说比较传统的一类方法--贝叶斯方法.它是在机器学习和人工智能里比较经典的方法. 类似的报告我之前在CCF ADL讲过,包括去年暑假周老师做学术主任在广州有过一次报告,大家如果想看相关的工作,我们写了一篇文章,正好我今天讲的大部分思想在这个文章里面有一个更系统的讲述,大家可以下去找这篇文章读. 这次分享主要包括三个部分: 第一部分:基本理论.模型和算法 贝叶斯方法基础 正则化贝叶斯推

中国人工智能学会通讯——无智能,不驾驶——面向未来的智能驾驶时代 ( 下 )

到目前为止似乎比较完美,而实际还 存在着一些问题.我们现在看到很多道 路上面,交通标志牌它的分布非常稀疏, 可能每过一两公里才能够检测出来一个 交通标志牌,因为毕竟这个深度学习算 法是目前最完美的,它有时候还会错过 一个交通标志牌,这时候怎么办呢?我 们会发现在路面上也有非常明显的视觉 特征,我只要把路面的这些视觉特征识 别出来进行匹配,其实是有连续的绝对 的视觉参考的.所以我们做的办法是, 把这个路面粘贴起来.这个粘贴的方法 很简单,跟我们手机拍场景图片一样, 我们慢慢移动的时候可以把这个场景

中国人工智能学会通讯——深蓝、沃森与AlphaGo

在 2016 年 3 月 份,正当李 世石与AlphaGo 进行人机大战的时候,我曾经写过 一 篇< 人 工 智 能 的 里 程 碑: 从 深 蓝 到AlphaGo>,自从 1997 年深蓝战胜卡斯帕罗夫之后,随着计算机硬件水平的提高,计算机象棋(包括国际象棋和中国象棋)水平有了很大的提高,达到了可以战胜人类最高棋手的水平.但是,长期以来,在计算机围棋上进展却十分缓慢,在 2006 年引入了蒙特卡洛树搜索方法之后,也只能达到业余 5 段的水平.所以 AlphaGo 战胜韩国棋手李世石,确实是人

中国人工智能学会通讯——着力突破与创新 实现超越与引领

提 要 2016年3月,围棋人机大战的结果,在舆论界激起了惊涛骇浪:在科技界也引起了强烈反响.为了把握人工智能的发展现状和规律,探讨我国人工智能的发展战略,在中国人工智能学会和众多人工智能同行的支持下,由本文作者出面申请了一次高层战略研讨会,这就是以"发展人工智能,引领科技创新"为主题的香山科学会议.与会者同气相求.同心协力,站在国家战略的高度,以纵览全球的视野,通过深入的研讨和论证,凝聚了诸多宝贵的共识,形成了直送中央的<关于加快发展我国人工智能的专家建议>.本文简要介绍