中国人工智能学会通讯——深度学习的迁移模型 三、三种不同的迁移方法

三、三种不同的迁移方法

将这些概念加起来,就可以总结出三个不同的迁移方法

1.基于差异的方法

在哪里做迁移的转换、自适应。可以在某个层次来做,也可以在多个层次来做,如何来衡量两个领域之间的距离,可以用先验的这种概率、模型,也可以用联合概率、模型;另外还可以将源领域的信息加进来,建立一个更准确的Loss。这都是图像领域获得的知识,那自然语言会不会有类似的方式?

下面一篇描述NLP的文章也证明了这一点,假设我们把自然语言的深度处理分成三个层次,即E、H、O,如果我们锁定不变,而其他的层次有可能变化,也有可能不变化,这样可以发现,先迁移后微调的效果最好。

还有,在目标领域我们能够让它的再生后期做自适应的学习,就是开锁的这种,效果是最好的。

这个模型也可以发展到多模态,上面的源领域是图像,下面的可以是文字,可以让它们之间有一些层次可以分享。最后得到的系统就是既可以理解一个源领域(比如图像可以转化为文字),又可以把文字转化成图像。另外还可以加入正则化,我们可以变化各种各样的正则,使得靠上层的层次之间互相靠拢。

2.传递式迁移学习

有了刚才的这些层次概念,可以将迁移学习进一步的发展。过去的迁移学习都是给一个源领域、一个目标领域,从源到迁移目标,现在我们可以多步迁移,从A到B,然后从B到C,就像石头过河一样的,这是我们最近做的工作,传递式的迁移学习。

传递式的迁移学习也可以利用深度学习的分层这个概念进行。我们右边这里有三类数据,有一个是源领域的数据,比如图像;有一个是目标领域的数据,比如说文字;中间有很多文字和图像混杂在一起的领域。一个做法就是在中间领域挑一些样本,让它更好地帮助源领域迁移到目标领域,这些就像中间石头过河一样的。

如何得到这个,在训练目标模型时就有两个数据,一个是不断地检测在目标领域的分类效果;另外一个是不断地尝试新样本,这些样本来自于中间领域和源领域,最后使整个不同的数据集之间形成一个新的数据集。

这样的一个理念在应用中也非常有用,这是斯坦福大学最近做的一项工作,是从一个图像到卫星图像区分在非洲大陆上的贫困情况,最后就发现这种传递式的迁移方法效果确实和人为地去采样、标注效果差不多,一个是0.776,一个是0.761,而它中间人为的参与大大减少,因为它用了传递的过程。

3.生成对抗网络 GAN

还有一种最近比较火的思想就是叫生成对抗网络GAN。它的思想来自两个模型交互,一个是生成模型,可以生成样板,就是右边的G模块,它一开始是非常粗糙的;还有是D模型,比较生成和真实的样本,它可以告诉你有没有被发现,生成模型生成的样本够不够好。经过它们两者之间的博弈,最后就产生了学习的跃进,使得G和D两者都得到了改进。

很多学者也用这个方法来做迁移学习,比如说给两个数据集。我们一开始并没有一个数据,并不知道这个包对应这个鞋,系统通过深度网络,可以把这个Alignment模型生成出来,根据这个模型找到一个最匹配的鞋的模型,而且是完全生成的,在原数据,鞋的数据集是没有的,就像右边这里展示的。这种也是迁移学习的概念。

Cycle GAN的思想也非常有趣,一个源领域可以迁移到一个目标领域,我们同样也应该让一个目标领域的数据、知识迁移到源领域,如果回来还能返回原来的样本,那么就是说明迁移已经学得靠谱了。就像我们拿一首唐诗到机器翻译的软件翻译成英文,然后再拿同样的软件再翻译回中文,我们大家知道往往得到像乱码一样的东西,完全回不到原来的一首诗,如果能够回到原来的诗,那翻译就靠谱了。概念也是类似的。

GAN的模型确实带来了迁移的新意,让两个领域同时做两件事。这个图表示做的两件事,绿色部分是两者共享深度学习的层次空间。如何找到这样的层次?就依靠第二件事,就是尽量找到一个区分领域的模型,我们有源领域A和目标领域B,如果有一天模型发展到我们区分不了数据来自哪个模型,那就说明共享的模型靠谱了,它就是抓住了两个领域之间的不变量,那就回到了左右开车的场景,那个不变量就找到了,这就可以用这部分做迁移。最后得到的领域,准确率最高的就是通过刚才的模型得到的。

时间: 2024-10-02 06:18:53

中国人工智能学会通讯——深度学习的迁移模型 三、三种不同的迁移方法的相关文章

中国人工智能学会通讯——深度学习与视觉计算 1.3 计算机视觉领域利用深度学习可能带来的未来研究方向

1.3 计算机视觉领域利用深度学习可能带来的未来研究方向 第一个,深度图像分析.目前基于深度 学习的图像算法在实验数据库上效果还是 不错的,但是远远不能够满足实际大规模 应用需求,需要进一步的提升算法性能从 而能够转化相应的实际应用.比如这个基 于图片的应用,可以估计性别和年龄,但 是其实经常会犯错,因此需要进一步提升 深度图像分析的性能. 第二个,深度视频分析.视频分析牵扯 到大量的数据和计算量,所以做起来更加 麻烦.当前深度视频分析还处于起步的阶 段,然而视频应用非常广泛,比如人机交互. 智

中国人工智能学会通讯——深度学习的迁移模型 二、如何实现迁移学习 : 深度学习 + 迁移学习

二.如何实现迁移学习 : 深度学习 + 迁移学习 今天我讲的是如何实现迁移学习中的一个方面.从单层次来看一个东西,把一个领域里的模型和知识通过层次分解,就好比杭州有雷锋塔,我们可以从一个古典的建筑发展到像雷锋塔这样有层次的建筑,一层一层分析,深度学习恰恰为我们提供了分层和层次. 下面我就仔细地描述一下.深度学习如果是从左到右.从输入到输出的变化过程,中间是有很多非线性的转化,我们可以忽略不计.但是这些层次我们要迁移到新的领域,知识的迁移就相当于参数的迁移,这些参数就是权重. 这里我们看知识到底有

中国人工智能学会通讯——深度学习在自然语言处理领域的最新进展

下面我来介绍一下深度学习在自然语言处理(NLP)的最新进展.我主要想针对机器翻译.聊天机器人和阅读理解这三个最活跃的方向来探讨深度学习在NLP领域的发展到了什么水平,还存在什么问题,然后再引申出未来的研究方向. 上图是自然语言处理主要技术的一览图.从左开始,第一列是自然语言的基本技术,包括词汇级.短语级.句子级和篇章级的表示,比如词的多维向量表示(word embedding).句子的多维向量表示,还有就是分词.词性标记.句法分析和篇章分析.第二列和第三列是自然语言的核心技术,包括机器翻译.提问

中国人工智能学会通讯——深度学习与视觉计算 1.1 视觉大数据

摘要:首先阐述什么是视觉大数据,以及视觉大数据分析需要解决的关键问题:然后介绍 了深度学习的发展背景,并简要回顾了深度学习在计算机视觉领域的发展历史:最后介绍 了深度学习在视觉计算中的一些工作,并讨论了未来潜在的研究方向. 1.1 视觉大数据 人类感知外部世界的时候,约有 70% 以上的外界信息是由视觉系统所接收和处 理的.因此,对于视觉信息的有效处理与 理解是非常重要的. 我们知道,从第一台光学成像设备产生 的那一刻开始,人们就在不断地改进成像 系统,希望能够更加真实地记录客观世界, 留下往日

中国人工智能学会通讯——深度学习与推荐系统 2 深度学习在推荐系统的应用

2 深度学习在推荐系统的应用 深度学习指代多层级的人工神经网络,近年来在语音识别.计算机视觉和自然语言处理等领域取得了巨大成功[32].根据深度学习技术在推荐系统中的应用方式,将相关工作大体分为两类:①作为一种基于数据的表征学习的方法,深度学习技术可以从语义较为丰富的输入数据(如语音.图片.文本等)中抽取出有效的特征表示,以方便下游应用,如检索和推荐等[11,14,17,33-40 ]:②作为一种通用的数据建模方法,深度学习对数据进行多层非线性变换,可以拟合出较为复杂的预测函数.推荐系统中的核心

中国人工智能学会通讯——深度学习与推荐系统 2.1 深度特征抽取(Extracting Side Features with Deep Learning)

2.1 深度特征抽取(Extracting Side Features with Deep Learning) 图4总结了一系列工作使用深度学习进行特征抽取,并用于协同过滤的基本框架.介于深度学习技术抽取出的特征通常是相对较短.稠密的向量(也称为嵌入式表示,embedding),可以和基于隐向量的矩阵分解方法无缝结合,因此这类工作大都采用矩阵分解模型进行协同过滤.例如,文献[33]在音乐推荐任务中,采用卷积神经网络(CNN)从音乐的原始特征中抽取出音乐表示,优化目标函数式(2)获得用户的隐向量:

中国人工智能学会通讯——深度学习与推荐系统 3 总结与展望

3 总结与展望 本文中简要介绍了推荐系统的核心技术,以及关于深度学习在推荐系统上的最新进展.可以看到,目前深度模型在推荐系统上的应用还处于比较初级的阶段[28],尤其是技术上的发展较慢于计算机视觉和自然语言处理领域.关于未来工作有如下三点展望. (1)在线学习与增量学习.在实际产品中,用户数据实时到达,为了更好地提供服务,推荐系统模型需要能够实时.有效地刷新推荐列表,这对模型的在线学习和增量学习带来挑战.现有的工作主要考虑矩阵分解等浅层模型的在线学习[13,16],对于深度模型的研究较为稀疏.

中国人工智能学会通讯——深度学习与视觉计算 1.2 深度学习在计算机视觉领域的应用

1.2 深度学习在计算机视觉领域的应用 深度学习近几年成为国际上非常流行 的重要的数据分析工具,在我们视觉计算 领域也得到了广泛应用.对于传统的视觉 信息处理而言,一般首先要做特征提取: 然后利用特征进行模型学习,比如分类等. 在这个过程中,涉及到模式识别研究中两 个经典的问题,即特征的提取与表示和模 型的学习. 传统算法通常利用经验知识来手工设 置视觉特征,缺少与环境的信息交互以及知 识库的决策支持.举个例子,给定一幅图 像,我们希望知道这幅图像的目标类别(比 如斑马).按照传统的视觉模式分析

中国人工智能学会通讯——深度学习与推荐系统 2.2 深度交互函数学习 (Learning Interaction Function with Deep Learning)

2.2 深度交互函数学习 (Learning Interaction Function with Deep Learning) 作为早期使用神经网络进行评分建模的代表性工作,文献[42]使用限制玻尔兹曼机(RBM)学习交互函数,但该方法的近似优化算法较为费时[28],且不易扩展到有辅助信息的情况.近期,我们在WWW2017上[6]提出了一个简单通用的基于神经网络的协同过滤框架(Neural Collaborative Filtering,NCF).其基本思想是将用户和物品表示为隐空间的低维向量后