专访阿里研究员袁全:从 AI 玩《星际争霸》谈认知智能的现状与趋势

不同于以提升点击率和转化率等优化指标为主的机器学习模型,认知计算以实现算法和智能化为核心,训练智能体的自主学习能力,以及多个智能体之间的协作和配合能力,和原来优化大数据和算法具有很大的区别。近日,笔者就认知计算、应用场景、算法优化、深度学习以及云计算&大数据技术的关系等问题与阿里认知计算实验室研究员、资深总监袁全进行了深入探讨。

阿里认知计算实验室研究员、资深总监袁全(左一)

深耕细作,瞭望人工智能新征程

“人工智能时代,我们专注认知计算研究,以积累核心算法系统为首要目标”——袁全。

袁全的研究始于06年开始的个性化推荐,彼时他在IBM研究院率先研发这一新技术。在12年加入阿里后,他主要负责手机淘宝、天猫的个性化推荐技术,包括算法、平台和产品的协同。袁全和他的团队致力于个性化推荐算法,典型产品有“有好货”、“猜你喜欢”等。15-16年团队主要研究淘宝首页的全面个性化,在去年年中的时候,以AlphaGo为代表的人工智能、认知决策技术的升级带来了非常多的新理念和新技术,袁全所带领的新团队也转战认知计算这一领域,目标是在人工智能时代,积累核心算法系统和能力。

挑战与机遇并存,认知学习深入解读

“最大的挑战在于它是一个非常新的多种类交叉学科,涉及内脑科学、认知心理学、机器学习甚至是博弈论,是一个全新的开始”——袁全。

推荐是经典的机器学习&大数据任务,依赖于每天产生的上亿用户数据,而认知计算最核心的能力是实现算法的智能化,提升智能体的自主学习能力,对大数据依赖性会变弱。从商品推荐到认知计算这一转变过程中,最重要的是要依靠认知科学来启发算法的认知设计,袁全表示,因为人脑是我们唯一所知的具有举一反三学习能力的物体,所以其中最大的挑战就在于它是一个非常新的多种类的交叉学科,涉及脑科学、认知心理学、机器学习甚至是博弈论,是一个全新的开始。

最近袁全带领团队在星际争霸游戏中对智能体的研究,则恰好验证了这一点。他们与伦敦大学学院计算机系汪军教授紧密配合,发布并开源了Gym StarCraft框架,探索新的训练智能体的方式,而不再像以前那样仅以提升学习指标为目标,而是致力于在一个干净的的环境中,训练智能体的自主学习能力,以及多个智能体之间的沟通与协作。事实上,《星际争霸》有其自身的特点,它的搜索空间比围棋更大,围棋是10的100次方数量级,而完整的星际游戏却是10的1000次方,整整大了10个数量级。而且不同于围棋双方博弈的透明性,《星际争霸》的决策是不确定性博弈,需要平衡短中长期的收益,与电商中的若干主要问题联系也很密切。( 论文下载:Multiagent Bidirectionally-Coordinated Nets for Learning to Play StarCraft Combat Games

应用于《星际争霸》游戏中的双向协调网络(BiCNet)

深度学习作为认知学习中重要推动力和实验工具,也已演化成研究智能的一个非常重要的平台,包括越来越多的国内外高校都在用深度学习去模拟人脑结构,尤其是深度神经网络对人脑的罗列和实现能力。当然后续也会结合其他流派的一些算法,例如结合符号主义、概率推理等,从而实现更好的学习能力。

机遇与挑战并存,更好的学习能力往往意味着更艰难的当下。袁全表示,在应用过程中,团队不断改进算法等技术,以期实现更佳的效果和用户体验。细化到算法调优上,不仅从agent通信机制间提高通信效率,还兼顾agent个体和全体收益,智能体的反馈激励机制优化、全局和动态信息的组合运用等,使得模型的通用性和扩展能力大大增强。

不过随着智能发展的火爆,各种AI威胁论也随之发酵。从团队的整个学习过程,以及AlphaGo等例子来看,智能的学习能力确实很有可能超越人类,机器协同效率远高于人的协同效率,很可能是一个催化要素,加之硬件和算法不断进步,智能对人类的威胁的确可能存在。现在看来最好的方式,是开放研究、共享新技术,多方共同逼近和实现目标;同时在AI的机制设定上,多引导其往人类不擅长、解决不了的问题上进行,与人类形成良性协作,相互增强。

另外,袁全还谈到了云计算、大数据与认知学习的微妙关系。诚然,智能体的训练对海量数据的处理能力提出了更高的要求,三者相辅相成,但是目前从很多的进展来看,小样本学习的技术也在不断提升,所以数据量级并非越大越好,学习能力越强的智能体对数据的依赖程度越低,这也是一个新的认知。

立足当下,美好蓝图亟待描绘

“引进智能化,理想情况就是说,每个用户背后都会有个智能体在专注地为他服务”——袁全。

在研究认知计算的过程中,袁全的团队由浅入深,不断补缀;结合AI在推荐等领域的应用,袁全认为利用AI去解决推荐的惊喜性问题,是一个技术和商业的很好结合。基于AI提供用户需要但自身并未意识到的商品和信息服务,逐步引进智能化,理想情况就是说,每个用户背后都会有个智能体在专注地为他服务。

给初学者的建议

对于想要从事个性化推荐、认知计算、通用智能的同学,袁全表示,扎实的功底必不可少,包括基础的编程能力和数学能力。在此之上,再根据个人的特点选择分支:甚至是一些偏深入研究的方向,例如,受脑神经科学启发的认知学习机制;或者选择通用智能领域,很多做通用智能的人都具有扎实的机器学习、强化学习背景;最后是非常重要的工程和系统架构能力,这是实现智能必不可少的一点。

时间: 2024-08-30 03:24:47

专访阿里研究员袁全:从 AI 玩《星际争霸》谈认知智能的现状与趋势的相关文章

韩国防部长怒了!回击朝鲜不是玩星际争霸!

本网(编译/于子将)据海外媒体报道,朝鲜炮击事件发生以后,韩国政府和军队都受到强烈批评,原因是有人说军方对朝鲜的炮击应对迟缓.军方上周三说,岛上部队有13分钟时间没有还击.这被归因于交战规则的模糊. 面对这一质疑,刚刚宣布辞职的韩国国防部长金泰荣(Kim Tae-young)则回应道:"这不是在玩<星际争霸>",以此辩称批评他的人实际上并不了解真正的开战准则. 上周二朝鲜向位于朝韩边境的延坪岛发射约170发炮弹,导致19座民房烧毁.韩国两名陆战队员死亡.15名陆战队员及三名

雷囧!韩国防部长称回击朝鲜不是玩星际争霸

本网(编译/于子将)据海外媒体报道,朝鲜炮击事件发生以后,韩国政府和军队都受到强烈批评,原因是有人说军方对朝鲜的炮击应对迟缓.军方上周三说,岛上部队有13分钟时间没有还击.这被归因于交战规则的模糊. 面对这一质疑,刚刚宣布辞职的韩国国防部长金泰荣(Kim Tae-young)则回应道:"这不是在玩<星际争霸>",以此辩称批评他的人实际上并不了解真正的开战准则. 上周二朝鲜向位于朝韩边境的延坪岛发射约170发炮弹,导致19座民房烧毁.韩国两名陆战队员死亡.15名陆战队员及三名

抢鲜“云计算”!iPad2爽玩星际争霸2

泡泡网显卡频道8月10日 自从有了家用机,电脑游戏和游戏机之间的争论就没有停息,直到现在也没有定论.对于玩家而言,手心手背都是肉,两难之下,模拟器大受欢迎.时过境迁,2010年一来,以iPad为首的移动平台游戏越来越多的进入了人们的视野. 完美的便携性,颠覆传统的触摸屏让这些移动设备有了得天独厚的优势.但相对孱弱的性能却大大影响了3D游戏在iPad上的使用体验,不支持flash等传统软件也让它的使用颇受局限,很多 网友感慨苹果的产品就和标志一样残缺.如果能既有Pad的便携性和触摸使用体验,又有台

专访360医药大数据负责人侯晓锋:谈未来智能医疗的挑战及实践

1.请介绍一下自己和贵公司的业务? 360好药为奇虎360旗下医药电商平台,网站(www.360haoyao.com由广州市增城慈福药业连锁有限公司注册)致力于创造简单.方便.值得信赖的健康产品购物体验.为了捍卫健康事业,360好药连接医疗健康产业,并依托360强大的技术能力,为中国网民及医药行业提供可靠可信可行的医药电商服务.医疗信息服务及"互联网+"技术解决方案,建立产业服务体系,推动提升医疗资源利用效率,推动提升全民健康管理水平. 360好药提供的服务,不止范围广,更时刻深挖发展

【阿法狗只是小儿科】5年内,AI将问鼎星际争霸,横扫人类玩家

本文讲的是5年内,AI将问鼎星际争霸,横扫人类玩家,对于人类来说,星际争霸是难度系数最高的游戏.而这一切即将改变.星际争霸AIIDE AI大赛负责人表示,五年内AI将能打败人类玩家,占据星际争霸主导权.这将会给医疗.技术中海量数据处理方式带来巨变. 接下来两周,纽芬兰纪念大学的一个小房间,将会成为银河系争霸的战场. 这既是银河系克普鲁星区主导权的争夺赛:也是AI掌握人类复杂性的一种探索. 纽芬兰纪念大学的一位计算机科学教授 David Churchill说,"这是我们对人工智能做过的最复杂尝试.

【星际争霸人类战胜机器】韩国选手4:0战胜Facebook等机构AI

 韩国的专业玩家在星际争霸游戏中以4:0的比分战胜了AI. 在人与AI最近的一次遭遇战中,韩国的专业玩家在星际争霸游戏中以4:0的比分战胜了AI.比赛于本周二在韩国的世宗大学举行. 虽然AI在本次比赛中击败了两位业余玩家,但是,在对阵专业级玩家宋炳具(Song Byung-gu)时,它们输掉了所有的比赛.宋炳具被认为是世界上最好的星际争霸职业选手之一. 参加本次比赛的AI系统有四个,分别是:来自韩国世宗大学的MJ Bot.来自澳大利亚的ZZZK.来自挪威的TSCMOO和来自Facebook的Ch

以《星际争霸》为例,阿里多智能体协作网络BiCNet展现人工集体智能无限潜力

阿里巴巴认知计算实验室与伦敦大学学院计算机系合作,以游戏"星际争霸1"(下简称"星际")中的微观战斗场景为测试环境,深入地研究了多个 AI 智能体之间的协作问题,旨在通过协作智能解决人类不擅长的问题.该研究引入的多智能体双向协调网络(BiCNet )可以自动学习各种最佳策略来使多个智能体协同作战,从无碰撞移动到基本的攻击和逃跑策略,再到复杂的掩护攻击和集中火力攻击.该研究所用的方法优于目前已有的最先进方法,多智能体协作完成复杂任务,显示出了在现实世界中电商.游戏.健

『干货』阿里研究员徐盈辉:在线AI技术在搜索与推荐场景的应用

近日,美国权威杂志<麻省理工科技评论>(MIT Technology Review)发布了2017全球十大突破性技术榜单,强化学习(Reinforcement Learning)技术位列该榜单第一位,正是阿里近两年布局和重点投入的技术之一. 该技术曾在2016年双十一期间大规模应用于阿里电商搜索和推荐应用场景.通过持续机器学习和模型优化建立决策引擎,对海量用户行为以及百亿级商品特征进行实时分析,帮助每一个用户迅速发现宝贝.为商家带来投缘的买家,提高人和商品的配对效率,实现了用户点击率提升10%

专访阿里AI Labs王刚:让具有人工智能能力的产品走进千家万户!

阿里巴巴人工智能实验室和它的杰出科学家王刚,一直保持着几分神秘感.我们专程到杭州对王刚博士进行了专访.王刚博士认为,谷歌的"一个模型解决所有的问题"是不现实的.他表示人工智能新硬件和降低智能终端成本.生物认知启发.量子力学和量子计算机与深度学习的结合是个人感兴趣的方向,除了最后一项,其他都是实验室目前正在研发的.他谈到了学术界和工业界研发过程的区别,并介绍了阿里的 AI 人才计划.为了进一步了解王刚和阿里人工智能实验室正在做的事情,我们介绍了 CVPR 2017 上阿里人工智能实验室入