《中国人工智能学会通讯》——8.18 单目标优化中的机器学习

8.18 单目标优化中的机器学习

●  分布估计算法

分布估计算法(EDA,estimation of distributionalgorithms)是一种典型的使用了机器学习技术的EA [3] 。其最大特点是不采用一般意义上的重组算子,而是显式地对一个概率分布进行采样获得新的候选解,同时在演化的过程中不断更新概率模型。EDA的性能很大程度上取决于如何构建概率模型,这是一个典型的机器学习问题。但另一方面,EDA 的目标是解决优化问题,由于在演化过程中需要反复构建概率模型,引入复杂的机器学习技术尽管可能得到更精确的概率模型,同时也会带来十分昂贵的额外计算开销,反而不一定能提升算法性能(如单位时间内的求解质量)。因此,尽管研究者从 EDA的提出之日起就考虑了使用概率图模型,早期的EDA 仍大多使用简单的概率分布模型(如高斯分布)。这些模型具有单峰的特点,在应对多峰优化问题时往往性能不佳。因此也有一些研究已尝试利用聚类技术将 EDA 的种群分为多个子种群,并基于每个子种群分别建模,在多峰问题上取得了较好的效果[4-5] 。

●  参数选择/调优/自适应

严格地说,EA 并非一个具体的算法,而是一个问题求解的一般性框架。该框架内的任何部件,例如候选解的表示、交叉、变异算子、选择机制(不失一般性,下文统称这些部件为参数)都可以根据不同的问题自定义配置。一方面,这保证了 EA 的普适性;但另一方面,由于参数与算法性能之间的关联是非线性的,参数可灵活配置往往给 EA 的实用带来了困难[6] 。利用机器学习自动配置参数的主要思路是通过机器学习方法显式地构建一个模型来刻画参数空间与问题空间的映射关系[5] 。在具体实践中,这样一个模型可以通过多种方式发挥作用,例如利用监督学习的方法构建“经验难度模型”(empiricalhardness model) [7] ,预测不同算法在典型 NP 难问题上的性能,从而实现算法参数的自动离线选择或优化;或是将参数的在线自适应视为一个强化学习问题加以解决[8] 。

●  复杂问题自动约简

“固定算法改问题”的思路同样可以借助机器学习的手段加以实现。具体地说,这类研究可视为利用机器学习技术发现待求解问题的某种近似形式,令 EA 求解近似问题而非原问题,从而在保证求解质量的同时提升算法效率。其中,最有代表性的一类工作是基于代理模型的 EA (SAEA,surrogate-assisted EA) [9] 。 与 EDA 类 似,SAEA同样在演化的过程中显式地维护、更新一个或多个模型。但不同于 EDA,这些模型主要被用于适应度评估而非生成新解,因此 SAEA 一般选用支持向量机、神经网络等分类或回归模型,而非概率模型。由于 SAEA 的主要目的是减少演化过程中调用原始问题目标函数的次数,因此主要适用于原始目标函数计算代价较高的问题。需要说明的是,SAEA 也并非要求模型的精度越高越好。首先,精确的模型往往具有较高的复杂度,从而可能带来显著的额外开销,因此 SAEA 需要结合具体问题在模型精度和计算开销之间进行折衷。其次,即使代理模型与原始问题差别很大,只要两者对应相同的最优解,引入代理模型甚至有可能直接降低问题的难度(如图2 所示) [10] 。
问题自动分解是机器学习在问题约简方面的另一类例子,其目的在于将大规模问题的自变量分为若干组,对每组变量分别构建规模较小的子问题,从而达到对大规模问题分而治之的效果。自变量分组是一个非典型的聚类问题,其特殊之处在于自变量之间的相关性(“距离”)不是已知的,而只能通过某种学习机制完成[11] 。同时,一些聚类方法也已被用于对变量分组[12] 。

除以上的例子外,机器学习还能从许多其他角度为演化计算提供新思路、新工具。例如,由于演化计算的理论基础还不完善,计算实验是评价算法性能不可或缺的手段。为了保证实验评估的全面、准确,应尽可能覆盖不同难度的测试样例。给定一个待测的 EA 及问题类,机器学习方法可用于发现对该算法最难的问题实例[13] 。又如,机器学习也可被用于分析不同问题实例间的相关性,以便为 EA获得高质量的初始解[14] 。这些方面的研究目前还处于探索阶段,有广阔的发展空间。

时间: 2024-08-29 13:11:55

《中国人工智能学会通讯》——8.18 单目标优化中的机器学习的相关文章

《中国人工智能学会通讯》——8.16 演化计算中的机器学习

8.16 演化计算中的机器学习 演化计算与机器学习是同属人工智能的紧密相连的两个研究方向,一方面演化算法 (EAs,evolutionary algorithms) 可以用于求解机器学习中的复杂优化问题:另一方面机器学习可辅助 EA.本文侧重后者. 需要指出的是,EA 本身也具有内在学习的能力,演化计算研究者从最初即意识到学习在 EA 中的重要性,例如遗传算法 (genetic algorithm) 中的积木块 (building blocks) 假设就是利用积木块来学习自变量之间的关联性,以提

《中国人工智能学会通讯》——8.5 鸽群优化在控制参数优化中的应用

8.5 鸽群优化在控制参数优化中的应用 经典 PID 控制方法在面对非线性和模型不确定性等因素时,难以满足控制性能的要求,同时控制器参数的选取会对被控对象的响应精度产生较大的影响.Dou et al [15] 将模型预测控制算法应用到了舰载机的控制器设计中,并通过使用鸽群优化对模型预测控制其参数进行优化设计,仿真分析表明,鸽群优化可以很好地对控制器参数进行优化设计,满足控制需求. Deng et al [16] 提出了一种新的自动着陆系统控制参数设计方法.为克服人工调参的问题,利用鸽群优化将参数

《中国人工智能学会通讯》——9.12 集成学习中的挑战性问题及解决方法

9.12 集成学习中的挑战性问题及解决方法 然而,传统的集成学习算法,特别是聚类集成算法,在集成器成员选择.聚类结果融合.集成器参数优化等方面还存在一些亟待解决的科学问题(见图 4): ① 集成器存在冗余成员,影响集成的最终结果:② 聚类集成算法集成器中多个聚类结果的融合质量有待进一步提高:③ 没有考虑到集成器参数往往受到外在环境(如样本空间和属性空间)和内在环境(如集成器基础模型的参数和权重)的影响. Yu et al [17] 针对上述科学问题,围绕"集成学习理论与应用",从集成器

《中国人工智能学会通讯》——10.23 能源互联网中的关键技术

10.23 能源互联网中的关键技术 现阶段可再生能源供应有很强的随机性.间断性和模糊性,成功并入电网并用其他形式高效利用存在很多技术上的难题:其次,对于能源互联网的建立,不仅要解决能源的高成本传输,以及能量输送损耗问题,还要对于能源互联网中产生的大数据进行实时处理,来预测和监控用户的需求变化,以及极端不稳定的能量生产供应变化.要解决上述问题并实现具体功能,能源互联网需要相应的技术体支撑.笔者认为,能源互联网的关键技术可以分为四个子技术,即体系架构技术.能源技术.信息通信技术和安全技术. 体系架构

《中国人工智能学会通讯》——6.14 知识图谱中的推理技术

6.14 知识图谱中的推理技术 知识图谱的概念由谷歌 2012 年正式提出,旨在实现更智能的搜索引擎.知识图谱本质上是一种叫做语义网络(semantic network)的知识库,即具有有向图结构的一个知识库,其中图的结点代表实体(entity)或者概念(concept),而图的边代表实体 / 概念之间的各种语义关系,比如说两个实体之间的相似关系.谷歌知识图谱很重要的一部分是一个大规模的协同合作的知识库,叫 Freebase.Freebase 采用的数据结构是图模型,即可以把一个 Freebas

《中国人工智能学会通讯》——8.4 鸽群优化在编队中的应用

8.4 鸽群优化在编队中的应用 多无人机紧密编队控制具有极强的耦合性和非线性,由于模型输入存在强耦合 , 并且性能指标与模型参数并不存在直接的映射关系 , 因此紧密编队模型控制输入的选取是一个关键技术难题.段海滨等人[13]提出了一种基于捕食逃逸鸽群优化的无人机紧密编队协同控制方法: 基于人工势场法设计了外环控制器 , 将无人机紧密编队转化成一种抽象的人造势场中的运动 ; 基于鸽群优化设计了内环控制器 , 进行控制量的优化求解.在遵循鸽群优化基本思想的基础上 , 对其结构进行调整 , 并针对基本

《中国人工智能学会通讯》——11.47 领域文本中的实体链接技术

11.47 领域文本中的实体链接技术 除了通用知识库,我们还拥有很多领域知识库(如 DBLP 文献网络 .IMDb 电影网络).将领域文本中的命名实体链接到相应领域知识库,对领域文本的分析和领域知识库的扩充非常有帮助.目前主流的实体链接算法都是针对通用的维基百科或者由维基百科生成的知识库(如 YAGO),这些算法都依赖于与维基百科相关的特征,例如维基百科文章中的上下文文本信息.基于维基百科的相关度度量,以及维基百科的一些特殊结构(如排歧页面.跳转页面等).由于领域知识库并不具备这些特征,所以之前

《中国人工智能学会通讯》——3.20 在线社会网络中的信息传播预测

3.20 在线社会网络中的信息传播预测 在线社会网络 (Online Social Network) 作为一种虚拟的社会平台,在人与人之间建立起具有社交.联系.分享和协助等功能的网络结构.近年来,互联网上涌现出的各种类型的社会网络深刻地改变了人们获取信息和相互沟通的方式.在线社会网络作为新的传播媒介,对传统媒体在信息传播中的主导地位产生了巨大的冲击.现阶段主要的在线社会网络包括微博.微信.博客.论坛及各类社交网站等.社会网络中的用户不仅仅是信息的受众,而且是信息的生产者和传播者.这种"去中心化&

《中国人工智能学会通讯》——4.17 智能信息服务中的粒计算

4.17 智能信息服务中的粒计算 所谓智能信息服务,是针对用户的信息需求,智能地对信息进行生产.收集.处理.加工.存储.传输.检索和利用,并以信息产品的方式为用户提供服务.信息即数据,智能信息服务和数据的分析与挖掘是紧密相关的,甚至可以说,数据分析与挖掘是当今智能信息服务的关键所在.随着信息通信技术的迅猛发展,特别是以博客.社交网络.基于位置的服务为代表的新型信息发布方式的不断涌现,数据正以前所未有的速度呈爆炸式增长.来势汹涌的数据浪潮,将人类带进了大数据时代. 然而,大数据自身存在的诸多问题,