2017 年最值得关注的科学概念之 “迁移学习”


Edge.org 为著名知识分子俱乐部 The Reality Club 的线上社区,自 1996 年上线,如今已有 20 年历史。在其创刊 20 周年之际,Edge.org 也推出了 2017 年度问题 —— 2017 年,最值得关注的科学术语或概念是什么?微软全球资深副总裁 Peter Lee 博士受邀应答,向大家介绍了迁移学习这一科学术语的前世今生

迁移学习

“你永远不能理解一种语言 —— 除非你至少理解两种语言”。

任何一个学过第二语言的人,对英国作家杰弗里·威廉斯的这句话应该都会“感同身受”。但为什么这样说呢?其原因在于学习使用外语的过程会不可避免地加深一个人对其母语的理解。事实上,歌德也发现这一理念的强大威力,以至于他不由自主地做出了一个与之类似但更为极端的断言:

“一个不会外语的人对其母语也一无所知”。

这种说法极为有趣,但令人惊讶的是恐怕更在于其实质 —— 对某一项技能或心理机能的学习和精进能够对其他技能或心理机能产生积极影响——这种效应即为迁移学习。它不仅存在于人类智能,对机器智能同样如此。如今,迁移学习已成为机器学习的基础研究领域之一,且具有广泛的实际应用潜力。

今天的机器学习领域主要围绕着能力可随数据及经验的积累而提高的算法,且已取得惊人进步,并由此催生出可比肩甚至超越人类智能的计算系统,例如具有理解、处理及翻译语言能力的系统。近年来,机器学习研究多聚焦在深层神经网络(DNN) —— 一种通过从大量数据中推断异常复杂模式而进行学习的算法概念。例如,向一台基于 DNN 的机器输入数千个英文录音片段及其对应文本,机器便可从录音与文字的关联中推断出相关模式。伴随着关联模式的逐渐精确,系统最终将能 “理解” 英语语音。事实上,今天的 DNN 已经相当成熟,一台功能强大的计算机在学习充分训练示例后,完全可以对真人对话进行文字速记,并达到比专业速记员更高的准确率。

一些人也许会很惊讶,计算机化的学习系统展现出迁移学习的能力。我们可以通过一项涉及两套机器学习系统的实验来思考这个问题,为了简单起见,我们将它们称为机器 A 和机器 B。机器 A 使用全新的 DNN,机器 B 则使用已经接受训练并能理解英语的 DNN。现在,假设我们用一组完全相同的普通话录音及对应文本来对机器 A 和 B 进行训练,大家觉得结果会怎样?令人称奇的是,机器 B(曾接受英语训练的机器)展现出比机器 A 更好的普通话技能,因为它之前接受的英语训练将相关能力迁移到了普通话理解任务中。

不仅如此,这项实验还有另一个令人更为惊叹的结果:机器 B 不仅普通话能力更高,它的英语理解能力也会提高!看来威廉斯和歌德确实说对了一点 —— 学习第二语言确实能够加深对两种语言的理解,即使机器也不例外。

迁移学习的理念至今仍是基础研究的课题之一,因此,许多根本性的问题仍然悬而未决。例如,并非所有的 “迁移” 都是有用的。要让 “迁移” 发挥作用,学习任务之间至少需要相互关联,而这种关联方式仍然缺乏精确定义或科学分析,且与其他领域相关概念之间的联系仍有待阐明,如认知科学和学习理论。诚然,对于任何一个计算机科学家而言,从事计算机系统的 “拟人化” 在理智层面都是危险的,但我们却不得不承认,迁移学习让人类学习和机器学习之间产生了强烈而诱人的相似性;当然,如果通用人工智能真能有朝一日成为现实,迁移学习恐怕将是这一过程中的决定性因素之一。对于善于哲学思考的人来说,迁移学习的正规模型可能会为知识和知识迁移带来新发现和分类方法。

迁移学习同样具有极高的应用潜力。过去,机器学习在搜索和信息检索等领域中的实用价值较为单一,大多聚焦于通过万维网上大量数据集和人物信息进行学习的系统。但我们是否想过,经过网络训练的系统可以了解关于较小社区、组织甚至个人的信息么?未来智能机器可以学习与特定个人或小型组织相关的、高度专业化的任务么?迁移学习让我们可以想象这样一种可能性,让所有网络信息都成为机器学习系统的基础,而系统则可通过迁移学习获得更个性化的信息。实现这个愿景,我们将向人工智能普及化迈出又一大步。

文章转载自 开源中国社区 [http://www.oschina.net]

时间: 2024-09-20 12:36:52

2017 年最值得关注的科学概念之 “迁移学习”的相关文章

游戏安全资讯精选 2017年第十七期:2017年最值得关注的出海游戏公司,微软十二月“周二补丁日”一览,中小企业公有云网络安全保障体系和混合云搭建实践

[游戏行业安全动态]2017年最值得关注的出海游戏公司 概要:在国内游戏市场人口红利耗尽的前提下,中国移动游戏市场在整体规模继续稳定增长的同时,端游页游厂商纷纷入局,渠道逐渐式微,买量成本暴涨等一系列因素,导致许多游戏企业的生存环境更加艰险.面对竞争如此激烈的市场环境,"不出海,就出局"渐成手游行业共识. 事实上,中国游戏正在全球范围内"猛烈进攻".根据报告显示,在2017上半年的25个成绩最突出的国家或地区中,中国移动游戏发行商已经获得了比去年同期高出130%的收

Gartner评出2017年最值得关注的11个顶级信息安全技术

在近日举行的Gartner安全与风险管理峰会上,Gartner评出了一个2017年最具影响力大11个顶级信息安全技术榜单,具体如下: 一.混合云负载保护平台 点评:当今的现代化数据中心的工作负载运行在各种各样的平台上,包括物理服务器.虚拟机.容器.私有云架构以及一个或者多个IaaS公有云架构.混合云负载保护平台(CWPP)能够为信息安全主管们保护工作负载.部署安全策略提供基于单一管理控制台的一体化方案. 二.远程浏览器 基于浏览器的攻击是目前针对个人用户最流行的攻击方式.信息安全架构并不能完全阻

2017年值得关注的十大IaaS云发展趋势

随着机器学习.无服务器计算与容器技术的快速兴起,企业对于云计算的依赖性也在快速提高. 根据分析师们的观察,IaaS公有云计算在美国市场2016年年内呈现出明确的三足鼎立局面:AWS.微软Azure与Google Cloud Platform取得遥遥领先的优势,而企业对三者提供的公有云服务的利用方式也出现了显著变化. 如今各云服务供应商开始为客户提供更多选择,包括遍布全球各地的主机.更多虚拟化实例配置以及工作负载优化机制,同时亦推出了更多对云环境内数据进行管理与分析的选项. 那么IaaS公有云市场

2017年值得关注的10家网络初创公司

业界发展的近10年中,创业公司在创业初期面临选择,所有的创业公司都希望能够跟上软件定义网络的潮流.随着对SDN的炒作逐渐减少,一些SDN初创公司如Embrane已经被收购,而其他的一些公司已经从SDN行业中转向其他行业,如Plexxi,现在号称"公有和私有云融合网络基础设施部署的先驱".在2016年底,专注网络虚拟化的初创公司PLUMgrid被VMware收购. 现在,仍然有大量的网络创业公司,虽然他们都号称纳入了SDN的概念,但他们不再专注于SDN.相反,他们专注于云网络.网络自动化

RSA 2017大会值得关注的十大趋势

每年在旧金山举行的RSA大会对于安全初创公司和传统厂商来说无疑是一年中最大的展示平台.去年RSA大会有3万名参会者,预计今年规模会更大,吸引着从还处于早期融资阶段的公司一直到规模数十亿美元的厂商.下周RSA 2017大会即将召开,我们与三大顶级网络安全厂商投资高管坐下来,一起探讨他们在今年的大会上会重点关注什么.从人工智能到物联网.再到安全自动化和编排,今年展会上有很多值得关注的地方. 人工智能 往年的RSA大会一直关注用户行为分析.异常检测和下一代端点安全.但是到了RSA 2017,Glass

2017年人工智能行业值得关注的9大预测

美国科技博客VentureBeat近日撰文,对2017年的人工智能行业发展进行了预测. 以下为原文内容: 人工智能成了2016年的热门话题,短期内似乎不会降温.过去一年发生的投资.收购.试点.重组和突破将推动人工智能行业在未来1年产生巨大影响.以下就是2017年人工智能行业值得关注的9大预测: 1.不再夸大其词 人工智能将从天上回归人间.我们不会再谈论牵强附会的人机对抗问题,而是会想尽办法利用人工智能将海量大数据转化成井然有序的信息,帮助我们实现各种梦想.当人们意识到人工智能能做什么.正在做什么

深度 | 人工智能、机器学习等,2016年值得关注的27项企业技术

企业技术一直以来都被当做消费科技之外的另一个风口,在今年最受期待的科技排行榜上,我们可以预测消费科技将会为企业技术留出此前从未有过的空间. 2016 最受期待的科技排行榜比以前更加拥挤.这不仅是因为今年出现了更多新技术,一部分是因为以消费者为导向的科技产业出现了更多的颠覆性进步,而企业则需要对此做出快速反应,以维持他们在市场上的地位. 今年出现的一些新技术的确有可能会在短期内真正地颠覆行业,虽然「颠覆」这个词最近已经被用烂了.他们包括区块链,数字化的用户体验管理,实时流处理,或快速数据. 从战略

最值得关注的五大IT基础设施发展趋势

2016年年内全球范围内的IT预算总额预计将于上年持平,对于大多数CIO们来说,这意味着他们必须找到最科学的办法来支配这有限的经济资源. 幸运的是,目前已经有一系列基础设施技术成果能够带来更为合理的投资回报.其中一部分项目拥有创造全新价值的潜力,也有一些能够切实帮助我们显著降低基础设施运营成本. 除了基础设施之外,数据安全又是另一个在新一年中值得关注的关键性议题.2015年已经有大量资金涌入了云安全领域.而在今年,预计还将有更多支出被用于更新内部已然过时的安全工具. 在今天的文章中,我们将着眼于

2016年最值得关注的移动端APP设计趋势

  不论移动端网页和APP之间有着怎样的争论,移动端APP的快速发展都是不争的事实,各种客户端的开发和接入已经成为常态.用户对于自己喜欢的品牌和服务,总期待官方能推出客户端,也正是在这种期待和需求之下,催生出越来越多的APP. 事实上,有APP分析机构的研究表明,用户每天耗费在手机和平板上的平均时长为158分钟,其中127分钟是耗费在各类APP中,而仅有31分钟是花费在浏览网页之上.且不去深究这个数字是否适用于不同的国家和地区,但是总体的趋势大家都看的很明白.用户的需求越来越多,如果开发者和厂商