专访阿里研究员袁全：从 AI 玩《星际争霸》谈认知智能的现状与趋势

不同于以提升点击率和转化率等优化指标为主的机器学习模型，认知计算以实现算法和智能化为核心，训练智能体的自主学习能力，以及多个智能体之间的协作和配合能力，和原来优化大数据和算法具有很大的区别。近日，笔者就认知计算、应用场景、算法优化、深度学习以及云计算&大数据技术的关系等问题与阿里认知计算实验室研究员、资深总监袁全进行了深入探讨。

阿里认知计算实验室研究员、资深总监袁全（左一）

深耕细作，瞭望人工智能新征程

“人工智能时代，我们专注认知计算研究，以积累核心算法系统为首要目标”——袁全。

袁全的研究始于06年开始的个性化推荐，彼时他在IBM研究院率先研发这一新技术。在12年加入阿里后，他主要负责手机淘宝、天猫的个性化推荐技术，包括算法、平台和产品的协同。袁全和他的团队致力于个性化推荐算法，典型产品有“有好货”、“猜你喜欢”等。15-16年团队主要研究淘宝首页的全面个性化，在去年年中的时候，以AlphaGo为代表的人工智能、认知决策技术的升级带来了非常多的新理念和新技术，袁全所带领的新团队也转战认知计算这一领域，目标是在人工智能时代，积累核心算法系统和能力。

挑战与机遇并存，认知学习深入解读

“最大的挑战在于它是一个非常新的多种类交叉学科，涉及内脑科学、认知心理学、机器学习甚至是博弈论，是一个全新的开始”——袁全。

推荐是经典的机器学习&大数据任务，依赖于每天产生的上亿用户数据，而认知计算最核心的能力是实现算法的智能化，提升智能体的自主学习能力，对大数据依赖性会变弱。从商品推荐到认知计算这一转变过程中，最重要的是要依靠认知科学来启发算法的认知设计，袁全表示，因为人脑是我们唯一所知的具有举一反三学习能力的物体，所以其中最大的挑战就在于它是一个非常新的多种类的交叉学科，涉及脑科学、认知心理学、机器学习甚至是博弈论，是一个全新的开始。

最近袁全带领团队在星际争霸游戏中对智能体的研究，则恰好验证了这一点。他们与伦敦大学学院计算机系汪军教授紧密配合，发布并开源了Gym StarCraft框架，探索新的训练智能体的方式，而不再像以前那样仅以提升学习指标为目标，而是致力于在一个干净的的环境中，训练智能体的自主学习能力，以及多个智能体之间的沟通与协作。事实上，《星际争霸》有其自身的特点，它的搜索空间比围棋更大，围棋是10的100次方数量级，而完整的星际游戏却是10的1000次方，整整大了10个数量级。而且不同于围棋双方博弈的透明性，《星际争霸》的决策是不确定性博弈，需要平衡短中长期的收益，与电商中的若干主要问题联系也很密切。（ 论文下载：Multiagent Bidirectionally-Coordinated Nets for Learning to Play StarCraft Combat Games）

应用于《星际争霸》游戏中的双向协调网络（BiCNet）

深度学习作为认知学习中重要推动力和实验工具，也已演化成研究智能的一个非常重要的平台，包括越来越多的国内外高校都在用深度学习去模拟人脑结构，尤其是深度神经网络对人脑的罗列和实现能力。当然后续也会结合其他流派的一些算法，例如结合符号主义、概率推理等，从而实现更好的学习能力。

机遇与挑战并存，更好的学习能力往往意味着更艰难的当下。袁全表示，在应用过程中，团队不断改进算法等技术，以期实现更佳的效果和用户体验。细化到算法调优上，不仅从agent通信机制间提高通信效率，还兼顾agent个体和全体收益，智能体的反馈激励机制优化、全局和动态信息的组合运用等，使得模型的通用性和扩展能力大大增强。

不过随着智能发展的火爆，各种AI威胁论也随之发酵。从团队的整个学习过程，以及AlphaGo等例子来看，智能的学习能力确实很有可能超越人类，机器协同效率远高于人的协同效率，很可能是一个催化要素，加之硬件和算法不断进步，智能对人类的威胁的确可能存在。现在看来最好的方式，是开放研究、共享新技术，多方共同逼近和实现目标；同时在AI的机制设定上，多引导其往人类不擅长、解决不了的问题上进行，与人类形成良性协作，相互增强。

另外，袁全还谈到了云计算、大数据与认知学习的微妙关系。诚然，智能体的训练对海量数据的处理能力提出了更高的要求，三者相辅相成，但是目前从很多的进展来看，小样本学习的技术也在不断提升，所以数据量级并非越大越好，学习能力越强的智能体对数据的依赖程度越低，这也是一个新的认知。

立足当下，美好蓝图亟待描绘

“引进智能化，理想情况就是说，每个用户背后都会有个智能体在专注地为他服务”——袁全。

在研究认知计算的过程中，袁全的团队由浅入深，不断补缀；结合AI在推荐等领域的应用，袁全认为利用AI去解决推荐的惊喜性问题，是一个技术和商业的很好结合。基于AI提供用户需要但自身并未意识到的商品和信息服务，逐步引进智能化，理想情况就是说，每个用户背后都会有个智能体在专注地为他服务。

给初学者的建议

对于想要从事个性化推荐、认知计算、通用智能的同学，袁全表示，扎实的功底必不可少，包括基础的编程能力和数学能力。在此之上，再根据个人的特点选择分支：甚至是一些偏深入研究的方向，例如，受脑神经科学启发的认知学习机制；或者选择通用智能领域，很多做通用智能的人都具有扎实的机器学习、强化学习背景；最后是非常重要的工程和系统架构能力，这是实现智能必不可少的一点。

时间： 2025-01-30 17:38:09

专访阿里研究员袁全：从 AI 玩《星际争霸》谈认知智能的现状与趋势

深耕细作，瞭望人工智能新征程

挑战与机遇并存，认知学习深入解读

立足当下，美好蓝图亟待描绘

给初学者的建议

专访阿里研究员袁全：从 AI 玩《星际争霸》谈认知智能的现状与趋势的相关文章

韩国防部长怒了！回击朝鲜不是玩星际争霸!

雷囧！韩国防部长称回击朝鲜不是玩星际争霸

抢鲜“云计算”！iPad2爽玩星际争霸2

专访360医药大数据负责人侯晓锋：谈未来智能医疗的挑战及实践

【阿法狗只是小儿科】5年内，AI将问鼎星际争霸，横扫人类玩家

【星际争霸人类战胜机器】韩国选手4：0战胜Facebook等机构AI

以《星际争霸》为例，阿里多智能体协作网络BiCNet展现人工集体智能无限潜力

『干货』阿里研究员徐盈辉：在线AI技术在搜索与推荐场景的应用

专访阿里AI Labs王刚：让具有人工智能能力的产品走进千家万户！