8.9 演化学习研究进展
机器学习[1]是人工智能领域最重要的分支之一,主要研究计算机如何通过利用经验自动提高自身的性能,并已成为智能数据分析的主要方法。按照监督信息的不同,机器学习问题可以分为监督信息完全的监督学习、没有监督信息的无监督学习,以及介于两者之间的弱监督学习,其中弱监督学习包括监督信息滞后的强化学习、监督信息缺失的半监督学习、多示例学习等。AAAI Fellow 美国华盛顿大学 P. Domingos 教授指出“机器学习=表示 +评估 + 优化” [2] ,即不同的机器学习问题的解决方案都包括模型的表示、学习目标的评估,以及达到学习目标的优化方法三个部分。可见,机器学习任务最终承载在优化方法上,优化方法的能力也决定了能够使用的模型表示和评估函数。然而各类机器学习任务都面临着 NP 难的优化问题,因此机器学习需要强有力的优化方法。
演化算法是一大类启发式直接优化算法,最初起源于对自然现象的模拟[3] ,具体的实现包括遗传算法、演化策略、演化规划、蚁群算法、粒子群算法等。尽管存在许多变种,演化算法具有一个通用的算法框架,如图 1 所示。演化算法首先随机生成一组初始解,然后迭代地通过某种方式产生新解,评估新解的目标函数值,并更新解集合,保留较好的解。在所有步骤中,只有评估新解这一步涉及目标函数的计算,其他步骤都与目标函数无关。可见演化算法对优化问题性质要求极少,只要解的好坏能够进行评估即可,因此可用于复杂的优化函数。对于更加复杂的多目标优化问题,其解与解之间的优劣可能不可比,求解的结果是一组帕累托最优解,而演化算法也能直接用于多目标优化问题。由于机器学习对优化的依赖,研究者们已经尝试基于演化算法求解机器学习中的复杂优化问题,并取得了很多成功的应用,形成了演化学习这一方向。
本文将简要介绍代表性的演化学习方法,特别针对演化学习理论基础薄弱的瓶颈,介绍演化学习理论方面的一些最新进展。