盘点丨DeepMind 2017年工作回顾:从AlphaGo Zero到Parallel WaveNet

引言

今年7月,世界排名第一的围棋选手柯洁在连胜20场比赛后发表讲话。这距离上次他在中国乌镇未来围棋峰会上与AlphaGo对弈已有两个月。他表示:“ 在与AlphaGo比赛之后,我彻底反思并重新思考了这次比赛,现在我可以看到这样的反思对我有很大的帮助。我也希望所有的棋手能够去思考AlphaGo下棋的思想和技法,这些都是很有意义的。虽然是输了,但我发现围棋的变化确实太大了,它还在不停的进步,我也希望自己能不断的进步,在自己的顶峰时期多待几年。”

图1,未来围棋峰会是一个为期5天的盛会,它有各式各样的比赛形式,包括两人对弈,团队对弈以及与柯洁1对1对弈。

柯洁可以说是围棋领域大师级的人物,听到他的上述发言使我们倍感荣幸。其实我们也受到柯洁的启发,他的这些感想暗示未来社会可以使用AI作为发现探索的工具,发现新知识,增加人们对世界的理解。特别是在机器辅助科学方面,我们希望人工智能系统能够帮助人们在应对气候变化和药物发现方面取得进展,或者能够寻找到复杂的新型材料以及帮助缓解医疗系统的压力。这种潜在的社会效益便是我们建立DeepMind的初衷,我们很高兴在应对基础科学挑战以及AI安全和伦理方面取得了持续的进展。

我们在DeepMind上所采用的方法受到神经科学的启发,旨在帮助人们在一些关键领域(如想象力,推理,记忆和学习)取得进展。以想象力为例:这种人类独有的能力在我们的日常生活中起着至关重要的作用,它使我们能够规划和推理未来,但这种能力对计算机来说却是极具挑战性的。我们以后将继续努力解决这个难题,今年引入了imagination-augmented agents(想象增强代理),它可以从环境中提取相关信息来帮助规划未来的工作

我们训练了一个神经网络来演示如何自动地控制模拟环境中的各种简化身体,这种方法受神经科学启发,也是我们工作中最受欢迎的演示之一。这种复杂的运动控制是人体智能的标志,也是我们研究计划的重要组成部分。虽然由此产生的动作有时候是狂野的,有时是笨拙的,但也取得了惊人的成功,而且还可以用于娱乐观赏。

图2,DeepMind运动控制示意图,链接:https://www.youtube.com/watch?v=gn4nRCC9TwQ

“我们知道技术不是价值中立的。我们不能在基础研究方面取得进展的同时,而不对我们技术的伦理和社会影响负责。”

此外,我们在生成模型领域也取得了进展。就在一年前,我们提出了WaveNet,这是一个产生原始音频波深度神经网络,它能够产生比现有的技术更好的且更逼真的模拟语音。那个时候,这个模型还是一个研究原型,而且直接用在消费产品中计算复杂度又太高。在过去的12个月里,我们的团队创造了一个新模型,将WaveNet的训练速度提高了1000倍。在10月份,我们发布了这个新的并行WaveNet(Parallel WaveNet)。现在我们已经将它部署在实际应用中,在谷歌助手(Google Assistant)中生成英语和日语的声音。

WaveNet的改进只是我们竭力使AI系统的构建、训练和优化变得更容易的其中一例。今年我们发布的其他技术,如分布式强化学习、基于总体的神经网络训练、新的神经结构搜索方法,同样使系统更容易构建、更精确和更快地优化。我们同时花了大量的时间创造新的、具有挑战性的环境来测试我们的算法,这其中就包括我们与暴雪合作开发“星际争霸2”。

我们知道技术不是价值中立的。我们不能在基础研究方面取得进展的同时,而不对我们技术的伦理和社会影响负责。这推动了我们在一些关键领域的研究,比如在深度学习的可解释性方面,我们一直在探索新的方法来理解和解释我们的系统。我们的团队也致力于开发切实可行的方法,来确保我们在享受未来科技带来的便利同时保持这些系统始终在人类有效地控制范围之内,这就是为什么我们有一个成熟的技术安全团队的原因。

图3,我们现在已经与四家NHS信托基金合作。

在十月份,我们又推出了DeepMind Ethics&Society这个研究项目,用以帮助我们探索和理解AI的实际影响,从而实现更大的社会效益。我们的研究受到了来自多个领域著名专家的指导,如哲学家Nick Bostrom、气候变化专家Christiana Figueres、研究员James Manyika以及经济学家Diane Coyle和Jeffrey Sachs。

人工智能发展必须切合社会的需求和关注点,这就是为什么我们要与许多合作伙伴开展关于如何设计和部署人工智能的合作。例如,领导算法正义联盟(Algorithmic Justice League)的Joy Buolamwini以及来自人权组织Article 36的专家和英国武装部队的专家,参加了Wired Live的会议,并讨论算法的偏见和限制致命自动化武器使用的问题。正如我们经常说的那样,这些问题太重要了,而且影响极为深远。

这也是为什么我们也需要和更多的领域开展合作来讨论如何预测和指导技术的发展方向,这些合作领域可以来自AI公司内部也可以是非AI公司。其中一个例子是我们今年共同主持的人工智能伙伴关系(Partnership on AI),它召集行业竞争对手、学术界和民间团体共同讨论AI的伦理问题。在过去的一年里,PAI已经迎来了43个新的非营利和已营利组织,以及一个新的执行董事Terah Lyons。在接下来的几个月里,我们期待与这个小组合作,研究广泛的主题,包括算法中的偏见和歧视、机器学习对自动化和劳动力的影响等。

“我们对我们在2017年的所有成果感到自豪,但我们深知DeepMind还有很长的路要走。”

我们深信利用技术来实现社会效益的重要性,并且技术在影响现实生活中健康和能源方面等方面仍然有着巨大的潜力。今年,我们同意与NHS医院信托建立新的合作关系,以部署我们的Streams应用程序,该应用程序支持NHS临床医生使用数字技术,去确定机器学习技术是否有助于提高乳腺癌的检测,这也是我们参与的研究机构联盟发起了一项开创性研究。

同时,我们也一直致力于监管在健康方面工作。信息专员在研究我们与Royal Free最初的合作中,取得了一些成果。DeepMind Health的独立评论人发表了第一份关于我们工作的公开年度报告,我们也从这些报告里总结了一些经验教训。他们的审查使我们以后的工作做的更好。我们已经在我们与患者和公众的交流上做了重大的改进,包括与病人和照顾者的研讨会,并且我们也在探索在我们的系统中建立可信度的技术方法,例如可验证的数据审计技术,我们计划将其作为一个开源工具发布。

我们对我们2017年的所有进展感到自豪,但知道还有很长的路要走。

在乌镇AlphaGo与柯洁对战并从竞赛中退役了AlphaGo 的五个月后,发表了我们的第四篇Nature论文,论文关于名为AlphaGo Zero的新版本系统,这个版本不需要任何先验知识。在数百万游戏的过程中,系统逐渐从头开始学习“围棋”游戏,短短几天就积累了数千年的关于围棋对战的知识。这样做也揭示了非常规策略,并且揭示了我们从围棋这个古老游戏中的获得的启发。

我们的信念是:人工智能作为一项科学工具和人类智慧的增效器可以在为其他更为复杂问题领域发挥更大的作用。AlphaGo团队已经在准备迎接下一个重大的挑战,同时我们希望AlphaGo团队借助围棋获得的算法上启发仅仅只是开始。

原文发布时间为:2017-12-26

时间: 2024-08-02 06:46:42

盘点丨DeepMind 2017年工作回顾:从AlphaGo Zero到Parallel WaveNet的相关文章

深度交流、融合发展—数据科学研究院各研究领域2017年度工作交流会如期举办

来自工业.医疗健康.经济金融.交通.基础设施.计算心理健康.科技情报数据.二维码安全技术.智慧城市.遥感等各科研代表们通过此次工作交流会,对现有的科研成果进行了分享,也借机了解到了其他领域老师的研究进展.同时,此次交流会也提供一个契机,让清华大学各院系大数据领域的老师们能够充分沟通,打破学术壁垒,实现大数据研究的融合发展. 部分与会老师合影 工业大数据研究中心科研代表刘英博老师表示:"科研人员在做研究项目的过程中,很多时候会涉及到与其他学科相重叠的地方.然而术业有专攻,单凭一己之力肯定会遇到不少

促进大数据发展2017年工作要点获审议通过

据工信部5月11日消息,日前,促进大数据发展部际联席会议第二次会议在北京召开. 部际联席会议副召集人.工业和信息化部副部长陈肇雄,部际联席会议副召集人.中央网信办副主任庄荣文,以及各成员单位相关负责同志出席会议,国务院办公厅电子政务办.信息公开办有关同志列席会议.会议由促进大数据发展部际联席会议副召集人.国家发展改革委副主任林念修主持. 会议原则审议通过<促进大数据发展2017年工作要点>.<政务信息资源目录编制指南>和<国家大数据专家咨询委员会设置方案>等文件,听取了

Deepmind AMA:关于最强ALphaGo如何炼成的真心话,都在这里了!

本文讲的是Deepmind AMA:关于最强ALphaGo如何炼成的真心话,都在这里了!, 刚刚,Deepmind在Reddit的Machine Learning板块举办了在线答疑活动AMA,Deepmind强化学习组负责人David Silver和其同事热情地回答了网友们提出的各种问题.由于在AMA前一天Deepmind刚刚发表了<Mastering the game of Go without human knowledge>(不使用人类知识掌握围棋)的论文,相关的提问和讨论也异常热烈.

【2017最佳机器学习论文】AlphaGo Zero最赏心悦目(一文读懂大咖论文)

前几天与杨静老师和刘江老师,讨论 2017 年人工智能进展时,没来得及说 2017 年最值得读的论文. "什么是最值得读的论文",这个话题,仁者见仁智者见智. 下面,说说我个人觉得今年收获最大的论文: 最赏心悦目:Mastering the Game of Go without Human Knowledge 最有实践价值:Attention Is All You Need 和 One Model To Learn Them All  最有研究潜力:Superhuman AI for

100:0!Deepmind Nature论文揭示最强AlphaGo Zero,无需人类知识

本文讲的是100:0!Deepmind Nature论文揭示最强AlphaGo Zero,无需人类知识, AlphaGo"退役"了,但Deepmind在围棋上的探索并没有停止. 今年5月的乌镇大会的"人机对局"中,中国棋手.世界冠军柯洁9段以0:3不敌AlphaGo.随后Deepmind创始人Hassabis宣布,AlphaGo将永久退出竞技舞台,不再进行比赛.同时Hassbis表示:"我们计划在今年稍晚时候发布最后一篇学术论文,详细介绍我们在算法效率上所

深度丨中科院田捷博士:基于医疗大数据和AI技术的影像组学及其应用丨CCF-GAIR 2017

7月9日,在由中国计算机学会(CCF)主办,雷锋网.香港中文大学(深圳)联合承办的CCF-GAIR 全球人工智能与机器人峰会的第三天,在未来医疗专场上,田捷博士做了"基于医疗大数据和人工智能的影像组学及其应用"的主题演讲. 田捷博士,是中国科学院自动化研究所研究员.Fellow of IEEE,SPIE,IAMBE,AIMBE,IAPR.其主要从事医学影像分析与生物特征识别的研究和应用的工作.田捷博士的很多学术论文.研究成果,均可见自国内外的各学术杂志和学术会议上,学术论文达上百篇.

未来医疗专场:医疗大数据与人工智能产业趋势丨CCF-GAIR 2017

雷锋网消息,7月9日,由中国计算机学会( CCF) 主办,雷锋网与香港中文大学(深圳)承办的第二届CCF-GAIR全球人工智能与机器人峰会进入了第三天.在下午的未来医疗专场上举行了题为"医疗大数据与人工智能产业趋势"的圆桌会议. 据雷锋网了解,此次圆桌会议由清华x-lab健康医疗创新中心主任钟宏主持, 中国医院协会疾病与健康管理专业委员会主任委员.清华大学健康中国领导力研究中心主任周生来:中科院"百人计划"副研究员.类脑计算课题组组长赵地:中国信息协会医疗卫生与健康

NIPS 2016精华大盘点丨吴恩达、LeCun等大师的论文、PPT都在这儿,别劳心去找了

2016 NIPS 仍在如火如荼地进行,各位大佬也频繁在会场露面,并时不时的搞个"大新闻".雷锋网时刻关注着 NIPS 的一切动态,并把大家较为关注的论文以及学术大师的PPT整理出来,方便大家学习和参考. 先打个招呼,正文和文末都有彩蛋. Yann LeCun  Yann LeCun 最近可谓是学术界的网红,上周先后录了三段视频为大家普及人工智能知识,现在又飞到西班牙见见粉丝,也不忘随时更新下 Facebook. Yann LeCun 受邀在今年的 NIPS 大会发表演讲.众所周知,深

UI设计汪汪Yuki丨云沃客工作经验分享

云沃客UI设计师 汪汪Yuki 擅长技能:PS.AI.AE.AX.SKETCH 个人简介:一枚来自 "瓷都"--江西景德镇的妹子.在职工作者&兼职远程办公.毕业后开始北漂工作和生活,现任职于北京某科技公司,平日里主要负责公司android&amp.ios平台的移动app产品的ui界面设计,移动端活动页面设计,同时也要配合产品经理进行软件界面优化以提高界面美观性和用户体验. 推荐理由:细心耐心.积极沟通.能够高度配合需求方的要求并发挥主观能动性 编者评价:软萌妹一枚,是个