2.31 跨环境抽象(Abstracting Across Environments)
人工智能领域的一个长期目标是实现人工通用智能,一个单一的学习程序可以同时在完全不同的领域进行学习和行动,可以转换一些学习到的技巧和知识,比如学会做饼干,并将这种技巧用在做布朗尼蛋糕上,甚至比以前做的更出色。在这种通用领域取得显著进展的是 Parisotto、Ba 和Salakhutdinov。他们在 DeepMind 上建立了开创性的 DQN,论文发表在今年的早些时候的《自然》杂志上,它可以学习玩很多不同的雅达利游戏,并且玩的还不错。
这个团队并没有在每个游戏上使用全新的网络,而是将深度多任务强化学习与深度迁移学习结合,这样可以在不同类型的游戏上使用同样的深度神经网络。这不仅仅会使得单个实例可以成功地在多个不同游戏中使用,而且还能更好更快地学习新游戏,因为它记得其他游戏的一些模式。比如,它可以更快地学习新的网球游戏,因为它在玩乒乓球的时候已经形成了这样的概念——用球拍击球是有意义的抽象。这还不算是通用智能,但是它是达到通用智能的一块垫脚石。
不同模式推理是今年的又一大亮点。艾伦人工智能研究所和华盛顿大学一直致力于研究测试对话 AI,经过多年的研究,已经从四年级水平测试提升到了八年级水平测试,今年他们宣布已经开发出一套系统可以解决美国高考中的几何学部分的问题。这些几何测试包括图表组合(combinations ofdiagrams)、补充信息(supplemental information)和词语问题(word problems)。在更小范围的AI中,这些不同的形式将典型地分别分析,基本上根据不同的环境。这套系统结合了计算机视觉和自然语言处理,将它们内嵌在同样的结构化形式体系中,然后应用集合推理来回答选择题,它的表现可以与美国高二年级学生平均水平媲美。
时间: 2025-01-27 02:07:49