中国人工智能学会通讯——深度学习的迁移模型 二、如何实现迁移学习 : 深度学习 + 迁移学习

二、如何实现迁移学习 : 深度学习 + 迁移学习

今天我讲的是如何实现迁移学习中的一个方面。从单层次来看一个东西,把一个领域里的模型和知识通过层次分解,就好比杭州有雷锋塔,我们可以从一个古典的建筑发展到像雷锋塔这样有层次的建筑,一层一层分析,深度学习恰恰为我们提供了分层和层次。

下面我就仔细地描述一下。深度学习如果是从左到右、从输入到输出的变化过程,中间是有很多非线性的转化,我们可以忽略不计。但是这些层次我们要迁移到新的领域,知识的迁移就相当于参数的迁移,这些参数就是权重。

这里我们看知识到底有多少可以从蓝色到橘色的、从源领域到目标领域,产生这样的迁移。我们可以看到,中间层有很多层参数可以共享;另外层次越高,可能它关心的高层的概念离得越远。我们关心的是领域之间的距离,能否把领域之间的距离刻画出来,在深度学习的初创期,有很多启发式的做法,其实很多概念是和迁移学习不谋而合的。

下面看看这样一种分层的研究对迁移学习到底产生了什么样的作用?我的学生魏颖就把最近的迁移学习和深度学习共同的工作画了表,这里面的名词像CNN、DDC都是最近发表的文章里面的系统名。横轴是年代,从2011年到最近,纵轴是准确率。左边是我的一些学生做的工作,把迁移学习在不同领域里的子空间,它们共享的知识找到,但是没有用到深度学习的概念,大概是2010年、2011年做的工作,叫TCA。

右边上面角是DAN,是深度学习加上迁移学习。我们看到深度学习加上迁移学习准确率大大提高,这不仅仅对理论有帮助,对工程的效率也是有帮助的。这里用一个距离的表述,使用MMD发现两个领域两个数据集之间的距离,这个距离是在网络的上层,从左到右,从下到上,更重要的是发现并且尽量减少这样的距离。

大家可以看到固定住,从一个领域迁移到另外一个领域,在下层比较容易迁移,在上层我们就关心领域之间的距离。

也有人把这个工作系统地进行了比较,我们可以看到代表迁移能力的红色是逐层下降的,从左到右逐层加深,如果是以深度学习的模型,下层在图像上比较容易迁移,在上层就不容易。我们在当中也可以做各种各样的演算和变化,比如可以让迁移过来的参数,让它在之后的领域里再得到重新训练,这样就会得到上面这条线。这条线放得越宽迁移能力就会变得越强,如果两个领域之间相差太大了,那么这个迁移是没办法进行的,就像下面这条蓝线直线下降,这个能力就不行。

关于模型迁移,我们关心两点。一是不同模型里面的一个层次,它的迁移量化。二是两个领域的距离有没有一个很好的衡量,这也为我们的研究提供了一个很好的指引方向,像这里几条线就是更进一步地说明我刚才表明的观点,第一个是细微的调参,就是目标领域帮助我们继续调参是有帮助的。

另外,从上层到下层是通用到个体的一种演化,大家看这些曲线是下降的。此外,我们关心两个领域之间的距离。

下面我们就可以利用这个观点,对于不同的知识迁移的场景进行总结。

●第一个是说我们在两个领域完全都没有标注的,目标和源数据都没有标注,这时就可以利用刚才的知识把下层固定住,直接迁移。在比较靠上层就可以放开,利用的方法是可以减少两个领域之间的距离,这个距离虽然没有标注,但我们还是可以把它衡量出来的,就像用刚才MMD的方法。

●还有一个方法就是用一个Loss描述,这也有所不同,比如两个领域之间的直接衡量。还有我们同时做两件事,第一件事是利用两个领域之间的距离,要把这个距离尽量减少;同时让每个领域能更好地表达它自己。

时间: 2024-09-27 16:13:39

中国人工智能学会通讯——深度学习的迁移模型 二、如何实现迁移学习 : 深度学习 + 迁移学习的相关文章

《中国人工智能学会通讯》——1.33 基础模型

1.33 基础模型 在自然语言处理中,很多任务的输入是变长的文本序列,而传统分类器的输入需要固定大小.因此,我们需要将变长的文本序列表示成固定长度的向量.以句子为例,一个句子的表示(也称为编码)可以看成是句子中所有词的语义组合.因此,句子编码方法近两年也受到广泛关注.句子编码主要研究如何有效地从词嵌入通过不同方式的组合得到句子表示.其中,比较有代表性方法有四种. 第一种是神经词袋模型,简单对文本序列中每个词嵌入进行平均,作为整个序列的表示.这种方法的缺点是丢失了词序信息.对于长文本,神经词袋模型

中国人工智能学会通讯——基于众包的数据清洗模型研究 3. 实验

3. 实验 本章我们将在真值发现和缺失填充两个数据清洗代表性应用上,验证提出模型的高效性和准确性. 数据集: (1)stock.该数据集收集了2011年7月的所有工作日约1 000只股票的信息,其中包括分别来自55个数据源的16个属性.我们用该数据集验证提出的模型,在真值发现应用上的有效性. (2)wine.该数据集包括200条记录,13个属性.我们用该数据集验证提出的模型,在缺失填充应用上的有效性. 实验设置:所有的实验在Intel(R) Core(TM) i5-2400 (3.10 GHz)

《中国人工智能学会通讯》——12.28 推断模型

12.28 推断模型 本章中给出一个推断模型,根据工人给任务的答案,它能够推断任务的关键词的真实结果.下面首先介绍模型的核心思想,然后给出模型构建与模型学习的一些细节. 建模核心思想 : 工人答案准确率的是建模的核心. 主要考虑如下因素对工人答案准确率的影响. (1) 工人质量.它包含两个部分.① 工人自身质量.由于工人自身能力与背景知识的差别,每个工人有不同的自身质量.自身质量很低的工人,比如说一些恶意的工人或者对任务完全一无所知的工人,他们给出的答案往往是易错的.② 距离相关质量.工人对任务

中国人工智能学会通讯——深度学习与视觉计算 1.3 计算机视觉领域利用深度学习可能带来的未来研究方向

1.3 计算机视觉领域利用深度学习可能带来的未来研究方向 第一个,深度图像分析.目前基于深度 学习的图像算法在实验数据库上效果还是 不错的,但是远远不能够满足实际大规模 应用需求,需要进一步的提升算法性能从 而能够转化相应的实际应用.比如这个基 于图片的应用,可以估计性别和年龄,但 是其实经常会犯错,因此需要进一步提升 深度图像分析的性能. 第二个,深度视频分析.视频分析牵扯 到大量的数据和计算量,所以做起来更加 麻烦.当前深度视频分析还处于起步的阶 段,然而视频应用非常广泛,比如人机交互. 智

中国人工智能学会通讯——无智能,不驾驶——面向未来的智能驾驶时代 ( 下 )

到目前为止似乎比较完美,而实际还 存在着一些问题.我们现在看到很多道 路上面,交通标志牌它的分布非常稀疏, 可能每过一两公里才能够检测出来一个 交通标志牌,因为毕竟这个深度学习算 法是目前最完美的,它有时候还会错过 一个交通标志牌,这时候怎么办呢?我 们会发现在路面上也有非常明显的视觉 特征,我只要把路面的这些视觉特征识 别出来进行匹配,其实是有连续的绝对 的视觉参考的.所以我们做的办法是, 把这个路面粘贴起来.这个粘贴的方法 很简单,跟我们手机拍场景图片一样, 我们慢慢移动的时候可以把这个场景

中国人工智能学会通讯——机器学习里的贝叶斯基本理论、模型和算法

非常感 谢周老师给这个机会让我跟大家分享一下.我今天想和大家分享的是,在深度学习或者大数据环境下我们怎么去看待相对来说比较传统的一类方法--贝叶斯方法.它是在机器学习和人工智能里比较经典的方法. 类似的报告我之前在CCF ADL讲过,包括去年暑假周老师做学术主任在广州有过一次报告,大家如果想看相关的工作,我们写了一篇文章,正好我今天讲的大部分思想在这个文章里面有一个更系统的讲述,大家可以下去找这篇文章读. 这次分享主要包括三个部分: 第一部分:基本理论.模型和算法 贝叶斯方法基础 正则化贝叶斯推

中国人工智能学会通讯——深蓝、沃森与AlphaGo

在 2016 年 3 月 份,正当李 世石与AlphaGo 进行人机大战的时候,我曾经写过 一 篇< 人 工 智 能 的 里 程 碑: 从 深 蓝 到AlphaGo>,自从 1997 年深蓝战胜卡斯帕罗夫之后,随着计算机硬件水平的提高,计算机象棋(包括国际象棋和中国象棋)水平有了很大的提高,达到了可以战胜人类最高棋手的水平.但是,长期以来,在计算机围棋上进展却十分缓慢,在 2006 年引入了蒙特卡洛树搜索方法之后,也只能达到业余 5 段的水平.所以 AlphaGo 战胜韩国棋手李世石,确实是人

中国人工智能学会通讯——着力突破与创新 实现超越与引领

提 要 2016年3月,围棋人机大战的结果,在舆论界激起了惊涛骇浪:在科技界也引起了强烈反响.为了把握人工智能的发展现状和规律,探讨我国人工智能的发展战略,在中国人工智能学会和众多人工智能同行的支持下,由本文作者出面申请了一次高层战略研讨会,这就是以"发展人工智能,引领科技创新"为主题的香山科学会议.与会者同气相求.同心协力,站在国家战略的高度,以纵览全球的视野,通过深入的研讨和论证,凝聚了诸多宝贵的共识,形成了直送中央的<关于加快发展我国人工智能的专家建议>.本文简要介绍

中国人工智能学会通讯——2016机器智能前沿论坛召开

2016 年 12 月 17 日,由中国人工智能学会.中国工程院战略咨询中心主办,今日头条.IEEE<计算科学评论>协办的"2016机器智能前沿论坛"暨"2016 BYTE CUP国际机器学习竞赛颁奖仪式"在中国工程院举办.论坛嘉宾包括中外顶尖的数据挖掘.机器学习,以及自然语言处理方向的专家学者. 与以往不同,本次论坛除介绍机器学习的重大进展和应用外,还着重讨论了机器学习技术在媒体数据上的应用,并为2016 BYTE CUP 国际机器学习竞赛的获奖选手进

中国人工智能学会通讯——Master虽优势较多 但仍有缺陷

近日,Master 在各大围棋网站横扫顶尖职业棋手,随后,谷歌 DeepMind 创始人德米什 • 哈萨比斯在 Twitter 上发布消息,证实了 Master 是 AlphaGo 的升级版.众所周知,围棋困难的地方在于它的估值函数非常不平滑,差一个子盘面就可能天翻地覆:同时状态空间大,也没有全局的结构.这两点加起来,迫使目前计算机只能用穷举法,并且因此进展缓慢.但人能下得好,能在几百个选择中知道哪几个位置值得考虑,说明它的估值函数是有规律的.这些规律远远不是几条简单公式所能概括,但所需的信息量