《中国人工智能学会通讯》——1.30 演化学习调研

1.30 演化学习调研

演化学习是基于演化算法来处理机器学习面临的优化问题的研究方向。演化算法源于 20 世纪 60 年代,随着计算设备的出现,研究者设计了在计算机中模拟生物进化过程的算法,包括遗传算法、演化规划算法、演化策略算法等,并发现这样的算法具有一定的优化能力,并且对优化目标函数的限制很少,可以用于目标函数不可导、不连续,甚至写不出目标函数的情况。 随着时间的发展,这些最初的算法以及之后设计的变种现在可以统称为演化算法(Evolutionaryalgorithms),因为这些算法有相近的算法结构,只是在参数选取、算子设计等实现上有所不同。机器学习任务中常常涉及到复杂的优化问题,例如学习模型的参数优化、监督学习中复杂损失函数的优化、聚类分析中样本划分的优化等。因此尝试使用演化算法来处理机器学习任务中的优化问题,就成为很自然的选择。

演化学习的思想可以追溯到计算机科学之父 AlanTuring 关于如何设计“智能机器”的设想[1] ,在他的设想中,机器需要通过学习,从“儿童机器”成长为有智能的机器,而这样一种“儿童”机器的设计,则是通过借鉴自然进化的原理进行设计。在演化算法出现后,演化算法的先驱也对处理机器学习问题颇有兴趣[2] 。而演化学习蓬勃发展,则是在 20 世纪 90 年代。

随着以 BP 算法为代表的神经网络方法的兴起,神经网络的优化成为受关注的问题,由于多层神经网络模型的总体性能与其权值关系复杂,对权值的优化目标函数存在大量局部最优解,传统基于梯度的优化方法往往受局部最优解所困,而神经网络结构的优化则是更为困难的问题。在这个时期,借助演化算法的通用优化能力,涌现出一批演化神经网络的工作,例如机器学习顶级会议 NIPS 上就有不少相关工作[3-5] ,在人工智能顶级会议 IJCAI’99 和 IJCAI’01 上都有专门的演化算法分组报告,IJCAI’03 上则是演化算法与神经网络结合的分组报告。然而,此后随着统计学习在机器学习中份量的增加与神经网络的衰退, 以及演化算法本身的一些不足,演化算法在上述会议的身影也暗淡下来。

本文受邀对演化学习在近 5 年的顶级会议上的发展进行调研,为此我们翻阅了 IJCAI(国际人工智能联合大会)、AAAI(美国人工智能协会会议)、ICML(国际机器学习会议),以及 NIPS(神经信息处理系统进展会议)上发表的论文,其中 IJCAI 和 AAAI 一般认为是人工智能领域顶级国际会议,ICML 和 NIPS 一般认为是机器学习领域的顶级国际会议。这里需要说明的是,演化学习更多的论文发表在演化计算领域很好的期刊和会议上,包括 IEEE Transactions on EvolutionaryComputation、Evolutionary Computation journal、PPSN、GECCO 等,IJCAI、AAAI、ICML、NIPS 会 议上的论文并不能反映出演化计算和演化学习发展的全貌。然而从人工智能和机器学习会议的角度,也许更能反映出演化计算对领域之外的影响和外领域对演化
计算的认识。还需要说明的是,由于文章查阅量较大,虽然笔者已尽力细致阅读,但难免会有疏漏。在这四个会议上,演化学习的相关论文可以被分为三类:理论基础、算法改进,以及算法应用 。

● 在理论基础方面,AAAI’11 短文 [6] 对一种演化算法的收敛性进行了分析;AAAI’12 论文 [7] 对演化算法在一类 NP 难问题上的参数时间复杂度进行了分析;IJCAI’15 论文 [8] 对演化算法在二值约束问题上的近似性能进行了分析。从分析的指标来看,由收敛性、时间复杂度到近似性能,说明理论基础方面的研究越来贴近实际应用的需求;从分析的问题来看,从具体问题到更一般的问题,可以覆盖的应用越来越广。

● 在算法改进方面,AAAI’10 论文 [9] 针对 TSP问题设计了更高效的树形解表示方法和相应的算子;AAAI’11 论文 [10] 在收敛性理论指导下改进了蚁群算法并用于寻找多个最优解;IJCAI’11 论文 [11] 使用近似度来指导多目标优化;AAAI’12 短文 [12] 在 SAT 问题上为 CMA-ES 算法引入重组算子;AAAI’14 论文 [13]针对一种游戏设计了大规模演化算法。相对于演化算法初期对算法改进的启发性,可以发现上面这些改进都更针对优化问题的性质,也更倾向于理论的指导。

● 在算法应用方面的论文数量最多,包括在人工智能系统中的应用[14-15] 、在生物信息学上的应用 [16-17] 、在算法调参上的应用[18] ,而更多的则是与机器学习任务的结合。在与机器学习任务的结合中,最为显著的是在离散选择问题和强化学习任务上。离散选择问题上,AAAI’15 论文 [19] 在非监督特征选取中使用了演化算法;AAAI’15 论文 [20] 在模型选取时使用了演化算法;NIPS’15 论文 [21] 研究了基于演化算法的特征选择并分析了其理论性质。强化学习任务上,NIPS’13论文 [22] 将基于函数近似动态规划类别的强化学习方法在 Tetris 游戏上首次做到有效,其方法中包含了演化算法步骤;另外还有在机器人足球[23] 、路径积分的策略提升方法[24] 、高致信度策略提升方法 [25] 、机器人自动编程[26] 、多目标强化学习 [27]等任务上结合进了演化算法。究其原因,离散选择直接对应了难以处理的 NP 难问题,而强化学习中的滞后反馈导致其优化问题的搜索空间巨大,传统优化方法在这两类问题上难以奏效,因此成为了演化算法的用武之地。除此之外,在排序学习[28] 、社交网络 [29] 、规则学习 [30]等方面也有结合演化算法的工作。另外一类有趣的应用,是在其他的优化算法中使用到了演化算法,例如NIPS’11 论文 [31] 中贝叶斯优化的内层优化使用了演化算法、NIPS’14 论文 [32] 中后验估计使用了演化算法,AAAI’15 论文 [33] 则是结合了演化算法中的算子。可见演化算法可以在许多方面与机器学习任务结合并发挥作用。

还有论文中称受到了演化算法的启发[34] ,然而这样论文我们并没有记入演化学习相关论文中。图 1 显示了论文数量与年份的关系。从大体趋势上可以发现,最近几年演化学习的研究呈现了上升的势头,2015 年的论文数量有明显增加。

另外一些论文也对演化学习算法的现状指出了不足之处,例如论文 [35] 指出目前演化学习算法的理论基础不足、缺乏理论保障;论文 [36] 指出演化学习算法难以处理大规模问题;论文 [37] 指出演化算法由于优化的盲目性使得效率有限。这些不足之处恰恰是演化学习进一步发展的重要方向:建立完善的理论基础,发展大规模演化学习方法,结合具体问题的性质以提高效率。

在这些论文中,也出现了国内研究者的身影,例如论文 [8,20-22] 由南京大学 LAMDA 组独立完成、论文 [38] 来自中山大学、论文 [30] 来自哈尔滨工业大学、论文 [28] 来自山东大学。

近期机器学习的发展显示出研究者对凸优化的兴趣逐渐转向了非凸优化,例如 IJCAI’15 的两篇Distinguish Paper 均与非凸优化有关,NIPS’15 的论文题目中出现非凸优化的就有 3 篇,并且 NIPS’15 上还召开了非凸优化的 Workshop,深度神经网络的蓬勃发展也预示着复杂的网络模型需要更有效的优化方法。演化学习还处在萌芽阶段,随着对演化学习理论基础的完善与效率的改进,可以预见演化学习将保持上升势头,未来机器学习任务中的非凸优化能得到更好的解决。

时间: 2024-08-21 21:29:54

《中国人工智能学会通讯》——1.30 演化学习调研的相关文章

中国人工智能学会通讯——深度学习与视觉计算 1.3 计算机视觉领域利用深度学习可能带来的未来研究方向

1.3 计算机视觉领域利用深度学习可能带来的未来研究方向 第一个,深度图像分析.目前基于深度 学习的图像算法在实验数据库上效果还是 不错的,但是远远不能够满足实际大规模 应用需求,需要进一步的提升算法性能从 而能够转化相应的实际应用.比如这个基 于图片的应用,可以估计性别和年龄,但 是其实经常会犯错,因此需要进一步提升 深度图像分析的性能. 第二个,深度视频分析.视频分析牵扯 到大量的数据和计算量,所以做起来更加 麻烦.当前深度视频分析还处于起步的阶 段,然而视频应用非常广泛,比如人机交互. 智

中国人工智能学会通讯——机器学习里的贝叶斯基本理论、模型和算法

非常感 谢周老师给这个机会让我跟大家分享一下.我今天想和大家分享的是,在深度学习或者大数据环境下我们怎么去看待相对来说比较传统的一类方法--贝叶斯方法.它是在机器学习和人工智能里比较经典的方法. 类似的报告我之前在CCF ADL讲过,包括去年暑假周老师做学术主任在广州有过一次报告,大家如果想看相关的工作,我们写了一篇文章,正好我今天讲的大部分思想在这个文章里面有一个更系统的讲述,大家可以下去找这篇文章读. 这次分享主要包括三个部分: 第一部分:基本理论.模型和算法 贝叶斯方法基础 正则化贝叶斯推

中国人工智能学会通讯——无智能,不驾驶——面向未来的智能驾驶时代 ( 下 )

到目前为止似乎比较完美,而实际还 存在着一些问题.我们现在看到很多道 路上面,交通标志牌它的分布非常稀疏, 可能每过一两公里才能够检测出来一个 交通标志牌,因为毕竟这个深度学习算 法是目前最完美的,它有时候还会错过 一个交通标志牌,这时候怎么办呢?我 们会发现在路面上也有非常明显的视觉 特征,我只要把路面的这些视觉特征识 别出来进行匹配,其实是有连续的绝对 的视觉参考的.所以我们做的办法是, 把这个路面粘贴起来.这个粘贴的方法 很简单,跟我们手机拍场景图片一样, 我们慢慢移动的时候可以把这个场景

中国人工智能学会通讯——深蓝、沃森与AlphaGo

在 2016 年 3 月 份,正当李 世石与AlphaGo 进行人机大战的时候,我曾经写过 一 篇< 人 工 智 能 的 里 程 碑: 从 深 蓝 到AlphaGo>,自从 1997 年深蓝战胜卡斯帕罗夫之后,随着计算机硬件水平的提高,计算机象棋(包括国际象棋和中国象棋)水平有了很大的提高,达到了可以战胜人类最高棋手的水平.但是,长期以来,在计算机围棋上进展却十分缓慢,在 2006 年引入了蒙特卡洛树搜索方法之后,也只能达到业余 5 段的水平.所以 AlphaGo 战胜韩国棋手李世石,确实是人

中国人工智能学会通讯——着力突破与创新 实现超越与引领

提 要 2016年3月,围棋人机大战的结果,在舆论界激起了惊涛骇浪:在科技界也引起了强烈反响.为了把握人工智能的发展现状和规律,探讨我国人工智能的发展战略,在中国人工智能学会和众多人工智能同行的支持下,由本文作者出面申请了一次高层战略研讨会,这就是以"发展人工智能,引领科技创新"为主题的香山科学会议.与会者同气相求.同心协力,站在国家战略的高度,以纵览全球的视野,通过深入的研讨和论证,凝聚了诸多宝贵的共识,形成了直送中央的<关于加快发展我国人工智能的专家建议>.本文简要介绍

中国人工智能学会通讯——2016机器智能前沿论坛召开

2016 年 12 月 17 日,由中国人工智能学会.中国工程院战略咨询中心主办,今日头条.IEEE<计算科学评论>协办的"2016机器智能前沿论坛"暨"2016 BYTE CUP国际机器学习竞赛颁奖仪式"在中国工程院举办.论坛嘉宾包括中外顶尖的数据挖掘.机器学习,以及自然语言处理方向的专家学者. 与以往不同,本次论坛除介绍机器学习的重大进展和应用外,还着重讨论了机器学习技术在媒体数据上的应用,并为2016 BYTE CUP 国际机器学习竞赛的获奖选手进

中国人工智能学会通讯——Master虽优势较多 但仍有缺陷

近日,Master 在各大围棋网站横扫顶尖职业棋手,随后,谷歌 DeepMind 创始人德米什 • 哈萨比斯在 Twitter 上发布消息,证实了 Master 是 AlphaGo 的升级版.众所周知,围棋困难的地方在于它的估值函数非常不平滑,差一个子盘面就可能天翻地覆:同时状态空间大,也没有全局的结构.这两点加起来,迫使目前计算机只能用穷举法,并且因此进展缓慢.但人能下得好,能在几百个选择中知道哪几个位置值得考虑,说明它的估值函数是有规律的.这些规律远远不是几条简单公式所能概括,但所需的信息量

中国人工智能学会通讯——混合智能概念与新进展

脑科学以阐明脑的工作原理为目标,近年来已成为最重要的科学前沿领域之一.脑功能计算.脑智能模仿再度成为学术界和产业界热议话题[1-4].欧盟.美国.日本相继启动了大型脑研究计划,强有力推动了人们对脑结构.脑功能和脑智能的探索和认识:另一方面,人工智能研究风起云涌,最近一个标志性事件是谷歌的AlphaGo以4:1战胜围棋世界冠军李世石[5],实现了围棋人工智能领域史无前例的突破.2016年9月斯坦福大学发布了<2030年的人工智能与生活>报告[6],全面评估了当前人工智能的进展.挑战.机遇与展望.

中国人工智能学会通讯——人工智能发展的思考

2016 年是充满了纪念意义的特殊的一年:80 年前的 1936 年,"人工智能之父"图灵提出了"可计算机器"的概念,为人工智能乃至现代信息科技奠定了基础:70年前的 1946 年,世界上第一台电子计算机ENIAC 在美国滨州诞生:60 年前的 1956年"人工智能"的概念首次被提出:50 年前的 1966 年,第一次颁发"图灵奖",到目前为止已经有 64 位获奖者:10 年前的2006 年,深度学习概念开始为大家所熟悉,并流