本文讲的是 DARPA:机器学习的关键限制条件是什么?,DARPA:让人工智能真的具有智能并不容易。
DARPA近期可能将上线一个名为“学习的关键限制条件” (Fundamental Limits of Learning, Fun LoL) 的项目,该项目的核心就是回答这一问题。研究人员将说明,追求终极学习机器的过程如何通过系统化、理论化的方式进行衡量。
DARPA说:“让人工智能真的具有智能并不容易。当前的机器学习技术多数依赖于大量基于数据的训练、充沛的计算资源,以及耗费时间的测试和错误方法。即使是这样,该过程基本也会导致学习的结果不易规范化,帮助解决类似问题或更复杂的概念。高级机器学习的过程毫无疑问将变得更加有效,但问题在于如何做到。迄今为止,我们对给出特定学习问题之后机器存在的限制、甚至是限制的来源条件都知之甚少。”
DARPA希望通过Fun LoL项目寻找数学框架、结构和方法,帮助回答类似于以下的问题:
要达到特定的性能指标,要给机器训练的样本量需要达到多少?换句话说,今年围棋人机大战中使用的少于3000万步的训练集合是否能够保证获取围棋冠军?如何确保这一点?
关键的平衡及其含义?换句话说,性能准确度、处理能力考虑
面向特定问题的特定算法究竟多么“有效”?
学习算法中能达到的性能指标离真正的上限还有多少差距?
训练数据中的噪声和错误将有什么影响?
创建数据的模型的统计结构将产生什么好处?
DARPA的项目主管Reza Ghanadan在一份声明中说:“我们看到了机器学习和人工智能的进步,计算机现在可以在Jeopardy、象棋、围棋等领域击败人类冠军。然而,目前缺少的是理解数据、任务、资源、性能指标方面之间关系的理论性框架。这些元素可以让我们更有效地将任务教给机器,让它们泛用已有的知识,解决其它领域的问题。通过Fun LoL,我们希望能够解释,如何通过系统化、理论化的方式,衡量并追踪创造终极学习机器的过程。”
对于现在的机器学习而言,即使是任务目标的细微变化也可能会导致程序员必须创建一个全新的机器学习步骤。“如果你简单更改几项围棋游戏的规则,机器就无法通过自己已经知道的知识推断出当前应该如何选择。程序员需要从细微处重新开始,基于新的规则重新载入数以百万的可能选择。”
近期有一些改善机器学习的努力。比如,谷歌今年早些时候公布了Cloud Machine Learning服务的内部测试版本,它可以让企业创建定制化的机器学习模型。要做到这一点,用户需要使用在谷歌的其它云服务中产生的数据。Cloud Machine Learning负责采集数据和训练,并使用得到的机器学习模型进行预测。
去年,高级情报研究计划署 (Intelligence Advanced Research Projects Agency, IARPA) 表示自己的五年期计划:来自大脑皮层的机器智能 (Machine Intelligence from Cortical Networks, MICrONS) 将为参与者提供一次“独特的机会,提出具有最大潜力的生物学问题,推动神经计算理论的发展,并通过精心设计的实验和数据分析获取答案。”
IARPA称,“在项目进行过程中,参与者将使用他们正在提升的对陈述、变换的理解,以及大脑使用的学习规则,创建拥有前所未有可用性的基于神经的机器学习算法。MICrONS的终极计算目标有:进行复杂的信息处理任务,比如单一事件学习、无人监督条件下的簇化、场景对应。最终,随着设备不断应用这类机器学习算法的成功版本,他们将开发出能够进行复杂信息处理任务的解决方案,达到类似人类的效率。”
IARPA说,“尽管机器学习在过去几年里取得了显著成果,使用当今顶尖技术的算法十分脆弱,而且无法通用化。相反,大脑能够健壮地在大量噪音和非线性变化中分开并归类信号,还可以通过单一案例推断出整个输入分类。”
IARPA称,神经科学和机器学习两大领域之间有效的知识交换十分迟缓,因为两个学科的科学目标、资金来源、知识储备、专门词汇。因此,在过去几十年内,神经计算领域出现的能够和现代机器学习算法整合的新思路并不多。