《中国人工智能学会通讯》——8.22 基于演化优化的网络社区检测

8.22 基于演化优化的网络社区检测

社区是网络中一部分节点的集合,同一个社区中的节点拥有相似的特征和性质。一般来说,社区内边的连接密度要大于社区间边的连接密度。网络社区检测就是通过一定的算法发现网络的社区结构。网络社区检测对于研究和分析潜在的网络拓扑结构具有十分重要的意义[1] 。

适应度函数

1 . 基于单目标优化模型的社区检测

●  模块度模型
模块度 (Q) 是单目标优化中使用最广泛的适应度函数,模块度的概念最早是由 Newman et al [2]提出的。其公式如下:
其中 n 和 m 分别表示网络中节点和边的数量。如果节点 i 和 j 在同一个社区,那么 =1;否则=0。Q值越大说明社区的划分效果越好。但是,将模块度作为适应度函数依然存在一些问题[3] :第一,优化模块度是 NP-hard 问题;第二,模块度存在分辨率极限。为了解决这些问题,科学家又提出了一些新的评价指标,如扩展模块度[4]等。同时针对加权、有向及自循环的网络又提出了新的评价指标 Q sw [5] 。文献 [6-7] 中对 Q sw 调整后将其应用于解决有向、加权网络的社区检测问题。

在现实生活中,很多网络中的节点往往不只属于某一个社区,文献 [8] 提出了新的模块度指标来检测网络中的重叠社区结构。除了以上的模块度评价标准,文献 [9] 提出了局部模块度指标;文献 [10]提出了二分模块度指标。

●  多分辨率模型
多分辨模型的提出是为了解决分辨率限制的问题。文献[11]提出了新的适应度函数——模块密度(D)。

2 . 基于多目标优化模型的社区检测

●  一般网络模型
将最大化社区内连接和最小化社区间连接作为两个目标,文献 [12] 提出了基于多目标演化优化的社区检测算法 MOGA-Net。在该方法中,社区检测被建模成多目标优化问题,并采用 NSGA-II 的框架解决这个问题。文献 [13] 提出了基于 MOEA/D 的多目标社区检测算法,这个工作的最大创新点在于采用了新的多目标模型。文献 [14] 提出了一个三目标优化模型。另外,文献 [15-16] 总结了多目标社区检测中目标函数的选择。

●  符号网络模型
对于符号网络的社区检测,文献 [17] 提出了基于 signed ratio association 和 signed ratio cut 的两目标模型;文献 [18] 采用 NSGA-II 的符号网络社区检测模型。

●  重叠网络模型
前面我们指出在现实生活中一些网络中的节点往往不只属于某一个社区。针对网络的重叠社区检测,文献 [19] 设计了一个基于三目标的演化优化算法,其中一个目标函数用于控制社区划分的质量,另外两个相互矛盾的目标函数用于权衡社区之间的重叠程度。

●  动态网络模型
动态网络是随着时间不断变化的特殊网络,分析动态网络可以有效地预测未来的变化趋势。学者们针对动态网络的社区检测设计了一系列的演化算法[20-21] 。

个体表示
在社区检测这类问题中,每个个体都代表了一个网络划分。一般来说,初始化个体时有两种典型的个体表示方式,一种是基因座编码方式[12-13] ;另一种是字符串编码方式[22-24] 。

基因座编码方式显性地表达了网络的连接关系,但是相应的算子,如交叉、变异算子很难设计。字符串编码方式简单,并且有利于初始化编码和遗传算子设计。

遗传算子
交叉和变异是最常用的遗传算子,目的是产生新的后代种群以利于繁殖更新。对于基因座编码方式来说,均匀交叉和两点交叉是目前解决社区检测问题的最具有代表性的交叉算子。均匀交叉和两点交叉都能保持网络中的有效连接,文献 [12-13] 采用了均匀交叉的方式;文献 [13,25-26] 采用了两点交叉的方式。对于字符串编码方式来说,使用最广泛的交叉算子是单向交叉和双向交叉,双向交叉是对单向交叉的改进,它可以有效地结合父代个体共同的优秀特征。

最常用的变异算子是基于邻居的单点变异算子[12,22-24] ,它可以有效地避免对搜索空间的无效搜索,大大提高了算法的效率。

局部搜索
为了提高社区检测问题的搜索能力,在演化算法中常常引用了局部搜索方法。在文献 [22] 中,作者设计了基于爬山策略的局部搜索算子。爬山策略实质上是一种贪婪算法,通过对解的小幅度改变以得到目标值最大程度的提高。但是文献 [22] 提出的局部搜索方法容易造成无效搜索,往往使得算法效率较低。为了提高局部搜索的效率,学者们又提出了一些基于启发式的局部搜索方法。划分社区时,没有边连接的两点被划分在同一个社区内的可能性很小。基于这个启示,在文献 [23] 中,作者提出在局部搜索中将节点分配给邻近的社区以获得目标值最大程度的提高。为了进一步提高搜索能力,文献[24] 提出了一个基于三层学习策略的局部搜索方法,可以同时提高种群多样性及算法的全局搜索能力。另外,文献 [27] 提出了一个多目标局部搜索方法,可以权衡算法的收敛速度和种群的多样性。

时间: 2024-10-24 21:41:34

《中国人工智能学会通讯》——8.22 基于演化优化的网络社区检测的相关文章

《中国人工智能学会通讯》——1.30 演化学习调研

1.30 演化学习调研 演化学习是基于演化算法来处理机器学习面临的优化问题的研究方向.演化算法源于 20 世纪 60 年代,随着计算设备的出现,研究者设计了在计算机中模拟生物进化过程的算法,包括遗传算法.演化规划算法.演化策略算法等,并发现这样的算法具有一定的优化能力,并且对优化目标函数的限制很少,可以用于目标函数不可导.不连续,甚至写不出目标函数的情况. 随着时间的发展,这些最初的算法以及之后设计的变种现在可以统称为演化算法(Evolutionaryalgorithms),因为这些算法有相近的

《中国人工智能学会通讯》——8.9 演化学习研究进展

8.9 演化学习研究进展 机器学习[1]是人工智能领域最重要的分支之一,主要研究计算机如何通过利用经验自动提高自身的性能,并已成为智能数据分析的主要方法.按照监督信息的不同,机器学习问题可以分为监督信息完全的监督学习.没有监督信息的无监督学习,以及介于两者之间的弱监督学习,其中弱监督学习包括监督信息滞后的强化学习.监督信息缺失的半监督学习.多示例学习等.AAAI Fellow 美国华盛顿大学 P. Domingos 教授指出"机器学习=表示 +评估 + 优化" [2] ,即不同的机器学

《中国人工智能学会通讯》——8.16 演化计算中的机器学习

8.16 演化计算中的机器学习 演化计算与机器学习是同属人工智能的紧密相连的两个研究方向,一方面演化算法 (EAs,evolutionary algorithms) 可以用于求解机器学习中的复杂优化问题:另一方面机器学习可辅助 EA.本文侧重后者. 需要指出的是,EA 本身也具有内在学习的能力,演化计算研究者从最初即意识到学习在 EA 中的重要性,例如遗传算法 (genetic algorithm) 中的积木块 (building blocks) 假设就是利用积木块来学习自变量之间的关联性,以提

中国人工智能学会通讯——一种基于众包的交互式数据修复方法 5 相关工作

5 相关工作 数据修复旨在发现和修正数据库中错误的数据.在过去的几十年里,研究人员提出了各种各样自动发现并修复数据库中错误数据的方法[1].这些方法大致可以分为如下三类. (1)传统的方法先依赖各种约束条件,包括FDs[5,7].CFDs[6].完整性约束[4]和包含关系(INCs)[5]来检测数据中的由错误数据引起的不一致性(或冲突):然后用文献[2-4]中的方法修正所有的错误数据,从而解决所有的冲突.对一般的文本数据库,这一类方法中的大部分工作都是使用FD/CFDs进行修复,因为FD/CFD

中国人工智能学会通讯——意识科学研究进展 1.6 脑神经网络信息大规模获取和脑计划

1.6 脑神经网络信息大规模获取和脑计划 进入 21 世纪以来,认知科学得到更为 充分的关注.在全球范围内启动了多个脑 科学的重大科研计划.2013 年,美国启动 脑计划:2014 年,欧盟也实施了人脑计划: 此外,日本.中国等国相继或正在进行国 家级的脑科研项目. 美国的脑计划称为 The Brain Research through Advancing Innovative Neurotechnologies ( 简称 BRAIN),它由美国国防部 (DARPA). 国家卫生研究院 (NIH

《中国人工智能学会通讯》——8.5 鸽群优化在控制参数优化中的应用

8.5 鸽群优化在控制参数优化中的应用 经典 PID 控制方法在面对非线性和模型不确定性等因素时,难以满足控制性能的要求,同时控制器参数的选取会对被控对象的响应精度产生较大的影响.Dou et al [15] 将模型预测控制算法应用到了舰载机的控制器设计中,并通过使用鸽群优化对模型预测控制其参数进行优化设计,仿真分析表明,鸽群优化可以很好地对控制器参数进行优化设计,满足控制需求. Deng et al [16] 提出了一种新的自动着陆系统控制参数设计方法.为克服人工调参的问题,利用鸽群优化将参数

《中国人工智能学会通讯》——8.4 鸽群优化在编队中的应用

8.4 鸽群优化在编队中的应用 多无人机紧密编队控制具有极强的耦合性和非线性,由于模型输入存在强耦合 , 并且性能指标与模型参数并不存在直接的映射关系 , 因此紧密编队模型控制输入的选取是一个关键技术难题.段海滨等人[13]提出了一种基于捕食逃逸鸽群优化的无人机紧密编队协同控制方法: 基于人工势场法设计了外环控制器 , 将无人机紧密编队转化成一种抽象的人造势场中的运动 ; 基于鸽群优化设计了内环控制器 , 进行控制量的优化求解.在遵循鸽群优化基本思想的基础上 , 对其结构进行调整 , 并针对基本

《中国人工智能学会通讯》——8.3 鸽群优化

8.3 鸽群优化 基于鸽群在寻的过程中的特殊导航行为,Duanet al [7] 提出了一个新的仿生群体智能优化模型--鸽群优化算法.在这个算法中模仿鸽子寻的不同阶段使用的不同导航工具,提出了下面两种不同的算子模型. (1)地图和指南针算子(Map and CompassOperator):地图和指南针算子是模仿太阳和地球磁场这两种导航工具对鸽子的作用.鸽子通过磁感来感受磁场,从而在脑海中绘制地图,并把太阳当作指南针来调整方向.随着鸽群越来越逼近目的地,会逐步减少对太阳和磁性粒子的依赖. (2)

《中国人工智能学会通讯》——8.6 鸽群优化在图像处理中的应用

8.6 鸽群优化在图像处理中的应用 Duan et al [9] 将鸽群优化用于回声状态神经网络的参数优化,并将该改进后的递归神经网络算法用于图像复原,该图像复原算法可用于模糊图像复原和噪声图像复原.回声状态神经网络是一种递归神经网络,参数选择对该神经网络的性能有很大影响.首先使用正交设计策略初始化鸽群优化参数,通过对用不同程度和不同类型退化的图像进行复原以测试该图像复原算法的性能,并与多种其他图像复原算法进行了对比实验.实验结果表明,通过设置训练样本可以实验对不同程度和不同类型的退化图像进行复