在即将告别2017年之际,KDnuggets向多位机器学习和AI专家询问了哪些是2017年最重要的发展,以及他们对2018年关键趋势的预测有哪些。这份报告试图抓住2017年的重要事件,以及产业、学术和技术发展的脉搏,同时也尽力去展望即将到来的2018年的关键趋势。
被采访者是大数据、数据科学、人工智能和机器学习领域的一些顶尖专家。具体来说,采访的问题是:“在2017年,与机器学习和人工智能相关的主要发展是什么?2018年,你认为将看到哪些关键趋势?”
作为一个快速的回顾,去年的趋势和预测主要集中在以下议题:
- AlphaGo的成功
- 深度学习的热潮
- 自动驾驶汽车
- TensorFlow对神经网络技术商用化的影响
AlphaGo Zero令人兴奋,云竞争激烈
Xavier Amatriain:Curai的联合创始人兼CTO,之前是Quora的工程副总裁和Netflix的研究/工程总监。
如果一定要选一个今年的主要亮点的话,那就是AlphaGo Zero。这一新方法不仅在一些最有前途的方向上得到改进(例如深度强化学习),而且它还代表了一种范式转换,即模型可以在没有数据的情况下学习。最近我们也了解到,AlphaGo Zero还能推广到象棋等其他游戏。
至于人工智能的工程方面,2017年Pytorch开始升温,成为Tensorflow的一个对手,特别是在研究领域。
Tensorflow通过在Tensorflow Fold中发布动态网络,迅速作出反应。大公司之间的“AI战争”还包括许多其他的战役,其中竞争最激烈的是云。所有的主要供应商都增加了云的投入,并在云上增加各自的AI支持。亚马逊在他们的AWS中提出了大量的创新,比如他们最近发布Sagemaker用于构建和部署ML模型。另外值得一提的是,较小的玩家也在不断进入。Nvidia最近推出了他们的GPU云,这将成为训练深度学习模型的另一个有趣的选择。尽管有这么多竞争,但这个行业必要时可以团结起来,这是件好事。新的ONNX神经网络表示标准是实现互操作性的重要而且必要的一步。
2017年,围绕AI的社会问题也在延续(升级)。伊隆·马斯克(Elon Musk)认为我们越来越接近杀手AI的观点继续发酵,令许多人感到沮丧。关于AI在未来几年将如何影响工作,也有很多讨论。最后,我们看到更多的焦点放在AI算法的透明度和偏见上。
深度学习模型需要透明度
Georgina Cosma:诺丁汉特伦特大学科学与技术学院高级讲师
机器学习模型,尤其是深度学习模型,正在对医疗、法律体系、工程和金融等关键领域产生重大影响。但是,大多数机器学习模型不容易解释。在分析和诊断模型中,理解模型是如何实现预测的尤其重要,因为人类必须要有足够的信心去相信模型提出的预测。重要的是,一些机器学习模型的决定必须与法律法规相符。现在是创建足够透明的深度学习模型以解释它们的预测的时候了,特别是当这些模型的结果被用来影响或告知人类决策时。
AlphaGo Zero很伟大,但还算不上是突破
Pedro Domingos:华盛顿大学计算机科学与工程系教授,《终极算法》作者。
- Libratus(冷扑大师)在德州扑克上的胜利,将AI的优势扩展到不完善的信息博弈
- 自动驾驶汽车和虚拟助理的竞争日益激烈,Alexa在后者的竞争中势如破竹。
- 谷歌、亚马逊、微软和IBM之间云AI的竞争持续升温。
- AlphaGo Zero很伟大,但算不上是一个突破。self-play 是ML的一个存在已久的想法,而人类远远不需要下够500万盘棋才能掌握围棋。
2018年将是AI成熟的一年
Ajit Jaokar:主任数据科学家,牛津大学物联网数据科学课程的创建者。
2017年是AI的一年。2018年将是AI成熟的一年。我们已经从更多是“系统工程/云”的角度看到这一趋势。AI正在变得越来越复杂,h2o.ai这类公司则简化了部署AI的复杂性。
AI正越来越多地用于竞争优势,尤其是在工业物联网、零售和医疗领域,这将导致更大的颠覆。AI也正在迅速地部署到企业的各个层面(带来许多新的机会,但也将导致更多职业消失)。
我认为AI正在通过嵌入式AI(即跨越企业和物联网的数据科学模型)融合传统的企业和更广泛的供应链。
最后,传统行业将继续缺乏懂得AI/深度学习技术的数据科学家,例如银行业(尤其是工业物联网领域)。
智能自动化将渗透到各行各业
Nikita Johnson:RE.WORK创始人
2017年,ML和AI的发展取得了巨大的进步,尤其是最近DeepMind发表的通用强化学习算法,在自我对弈4个小时之后,击败了世界上最好的象棋程序。
2018年,我期望看到智能自动化渗透到各行各业的公司,从传统制造业、零售业到公共事业。随着数据收集和分析的不断增加,企业级自动化系统策略的需求将变得至关重要。这将使企业能够投资于一个更长期的AI计划,并确保它是未来增长和效率提升的优先事项。
我们还将看到自动化机器学习帮助非AI研究人员更容易使用机器学习技术,并使更多公司将机器学习方法应用到他们的工作场景。
meta-learning 和 few-shot learning
Hugo Larochelle:谷歌研究科学家,加拿大高级研究所Learning in Machines and Brains项目副主任
在机器学习的趋势中,我最感兴趣也最关注的是元学习(meta-learning)。元学习是一个特别宽泛的概括性术语。但今年,对我来说最令人兴奋的是 few-shot learning 的进展,它解决了发现学习算法的问题,这些算法从很少的样本中得到很好的泛化。 Chelsea Finn 今年年初针对这个问题写了一篇很好的总结文章:bair.berkeley.edu/blog/2017/07/18/learning-to-learn/。
今年有更多关于 few-shot learning 和 meta-learning 研究,包括使用深度时序卷积网络(arxiv.org/abs/1707.03141),图形神经网络(arxiv.org/abs/1711.04043)等等。meta-learning 方法也被用于主动学习(arxiv.org/abs/1708.00088),冷启动项目推荐(papers.nips.cc/paper/7266-a-meta-learning-perspective-on-cold-start-recommendations-for-items),few-shot分布估计(arxiv.org/abs/1710.10304),强化学习(arxiv.org/abs/1611.05763),分层RL(arxiv.org/abs/1710.09767 ),模仿学习(arxiv.org/abs/1709.04905),等等。
这是一个令人兴奋的领域,2018年我会继续密切关注。
2018年将成为全球“AI first”经济的突破之年
Charles Martin:数据科学家、机器学习AI顾问
2017这一年,我们看到了一个巨大的深度学习AI平台和应用程序。今年,Facebook发布了他们的Tensorflow竞争对手PyTorch。Gluon, Alex, AlphaGo等等成果不断。 机器学习从特征工程和逻辑回归发展到阅读论文,实现神经网络,优化训练效果。在我的咨询实践中,客户已经在寻求自定义对象检测,高级NLP和强化学习。当市场和比特币飙升的时候,人工智能一直是一场沉默的革命,零售业的启示激起人们认为人工智能将颠覆行业。公司都想要进行自我变革。我们非常感兴趣进行AI指导,包括技术层面和战略层面。
2018年必将成为全球“AI first”经济的突破之年。我们有来自欧洲、亚洲、印度、甚至沙特阿拉伯的需求。全球需求将继续增长,来自中国和加拿大的人工智能进步很大,印度等国家正从IT重新调整为人工智能。美国和海外的企业培训需求都很大。人工智能将实现大规模的效率,传统行业(如制造业,医疗保健和金融)将从中受益。人工智能创业公司将把新产品推向市场并全面提高投资回报率。而从机器人到自动驾驶汽车的新技术将会带来惊人的进步。
对于创新而言,明年将是伟大的一年。
以工具为中心的方法将减少,重要的是开发和实现利用深度学习的新想法和应用
Sebastian Raschka:密歇根州立大学应用机器学习和深度学习研究员和计算生物学家,《Python机器学习》的作者。
在过去的几年中,开源社区已经就所有新出现的深度学习框架进行了大量的讨论。现在,这些工具已经有所成熟了,我希望以工具为中心的方法会有所减少,期待将更多精力用于开发和实现利用深度学习的新颖想法和应用。我尤其期望看到用生成对抗神经网络和Hinton的capsule来解决更多问题。
“AGI”将会取代“AI”成为流行词
Brandon Rohrer:Facebook的数据科学家。
2017年还有更多机器击败人类的成就。去年,AlphaGo击败了世界上最好的人类棋手,通过了智慧之路上的一个长期里程碑。今年,AlphaGo Zero通过从零开始的自我对弈学习,超越了它的上一版本。(deepmind.com/blog/alphago-zero-learning-scratch)它不仅击败了一个人类,还击败了全体人类的围棋智慧。更实际的兴趣,一台机器现在可以从交换机基准来转录电话交谈。 (arxiv.org/abs/1708.06073)
然而,人工智能的成就仍然狭窄和脆弱。改变图像中的单个像素可以击败最先进的分类器。 (arxiv.org/pdf/1710.08864.pdf)我预计2018年将带来更多通用和强大的AI解决方案。几乎每个主要的科技公司都已经有了一个人工智能的工作。这些团体及其早期成果将成为头条新闻。至少,“AGI”将会取代“AI”成为当年的流行词。
机器学习系统“隐藏”技术欠下的债不容忽视
Elena Sharova是一家投资银行的数据科学家。
要说2017年机器学习/人工智能主要的发展,我看到越来越多的公司和个人将他们的数据和分析转移到基于云的解决方案,对数据安全的重要性的意识也急剧上升。
最大和最成功的技术公司已经竞相成为数据存储和分析平台。对于数据科学家来说,这意味着他们所开发的工具箱和解决方案正被这种平台所能提供的功能和能力所塑造。
2017年,全球发生了几起大型数据安全漏洞。这一点不容忽视。随着越来越多的数据转移到第三方存储,对于适应新威胁的更强大安全性的需求将继续增长。
至于2018年的关键趋势,一个是确保遵守《全球数据保护条例》(GDPR),另一个则是应对机器学习系统“隐藏”技术欠下的债,这笔债正在越变越多,不容忽视。GDPR作为一项欧盟法规,具有全球影响力,所有数据科学家应该充分意识到它对自己工作的影响。根据Google的NIPS’16论文,数据依赖性代价高昂,而且随着企业创建复杂的数据驱动模型,他们将不得不仔细考虑如何解决这一成本问题。
数据科学家正认识到无监督深度学习的价值
Tamara Sipes,Optum/UnitedHealth Group商业数据科学总监
2017年的主要发展和2018年的主要趋势:
- 深度学习和集成建模方法在2017年继续证明了它们相比其他机器学习工具的价值和优势。特别是深度学习,在各个领域和行业得到了更加广泛的应用。
- 至于2018年的发展趋势,深度学习可能会被用来从原始输入中产生新的特征和新的概念,并且取代手动创建或设计新变量的需求。深度网络在检测数据的特征和结构方面是非常强大的,数据科学家正在认识到无监督深度学习可以为此发挥的价值。
- 有效异常检测(Effective anomaly detection)可能也是近期的重点。在许多行业中,数据科学工作的重点是异常事件和其他类型的罕见事件:入侵检测、财务欺诈检测、诈骗、医疗保健中的滥用和错误以及设备故障等等。检测所有这些罕见的事件将会使企业在领域中产生竞争优势。跟上这些罕见事件检测的演变节奏,将是一个有趣的问题和困难的挑战。
深度学习框架变得更加用户友好且易于访问
Rachel Thomas,fast.ai创始人,USF助理教授。
虽然不像AlphaGo或者波士顿动力会后空翻的机器人那样华丽,但让我感到最兴奋的2017年AI趋势,是深度学习框架变得更加用户友好且易于访问。今年发布的PyTorch,对任何了解Python的人都很友好(主要是由于动态计算和OOP设计)。不过,TensorFlow也正朝着这个方向发展,将Keras纳入其核心代码库并宣布动态图运算。编码人员使用深度学习的门槛正变得越来越低。我预计2018年,这种开发人员可用性增长的趋势将持续下去。
第二个趋势是媒体报道专制政府监督人工智能的能力。2017年爆出了很多威胁隐私的新闻,但直到最近这才开始受到广泛的关注。利用深度学习来识别戴着围巾和帽子的示威者,或者通过图片来识别某人的性取向,使得今年有更多的媒体开始关注AI的隐私风险。希望在2018年,我们可以继续扩大讨论马斯克说的邪恶超级AI的话题,并解决通过编码涉嫌监视、隐私和对性别歧视和种族主义偏见的问题。
“可解释的AI”作为一门学科出现
Daniel Tunkelang是Twiggle的首席搜索传播者,也是众多知名组织的顾问。
2017年对于自动驾驶汽车和会话数字助理来说都是一个大年。这两个都是深度学习将科幻小说变为事实的应用领域。
但是,今年机器学习和人工智能最重要的发展,是对道德、问责和可解释性的持续关注。马斯克关于人工智能触发世界大战的启示性警告点燃了媒体,Oren Etzioni和Rodney Brooks等人则认真反驳。尽管如此,机器学习模型偏差的风险仍然存在,比如word2vec中的性别主义,算法在刑事判决中的种族主义,以及对社交媒体信息流的评分模型的故意操纵。这些问题都不是新出现的,但是机器学习的加速应用,特别是深度学习的大量使用,已经将这些问题推到了普通公众面前。
2017年,我们终于看到“可解释的AI”作为一门学科出现,汇集了学者、业界从业者和政策制定者的参加。2018年,照亮深度学习模型黑箱的压力和动力都将进一步加大。
原文发布时间为:2017-12-18
本文作者:Matthew Mayo
原文链接:【2018将成为AGI元年】13名专家盘点2017最重要AI事件,预测AGI将取代AI