8.39 合作模式分析
在合作模式分析中,首先定义三种合作网络,分别是作者合著网络、同现关键词网络和作者间共关键词网络[8] 。通过作者合著网络,可以看出作者间的合作次数与关系的密切程度;通过同现关键词网络,可以看出关键词经常同时出现的情况,并判断出研究主题之间的关系;通过作者间共关键词网络,可以看到作者间频繁使用的关键词信息,以此判断出哪些作者有相同或者相似的研究方向。
构建网络之后,通过对这些网络执行GN算法[9]来发现社区,每一个社区内部的节点都有着相对密切的联系,而不同社区的节点之间关系则比较疏远。
在可视化的过程中,使用 Ucinet 软件对网络进行了分析,同时使用 NetDraw 软件将社区网络图展示出来。
作者合著网络
作者合著关系是指两名研究者属于同一篇文章作者的情况,作者合著网络用来分析作者间的合著关系。在作者合著网络中,将作者作为网络的节点,如果两个作者是某篇文章的共同作者,在这两个作者之间建立一条边,以此构建作者合著网络。通过对网络进行划分,可以将作者合著网络划分成不同的社区,每个社区中的作者都有紧密的合作关系。作者合著网络并不是全连通的,而是由几个不同的连通子图构成。本文选取其中最大的三个连通子图分别执行 GN 算法,得到了如图 8 所示的三个社区网络。
如图 8(a) 所示,作者合著网络最大连通子图包含 419 个节点,总节点度数为 2 164,平均节点度为 5.16,连通子图被分成了 17 部分,每一部分都是合作关系最密切的一组作者。其中 Mark Harman的节点度最大,说明他在该领域与很多作者有很密切的合作关系,其他作者如 Robert M. Hierons、Xin Yao 等也与很多作者保持着密切的合著关系。同样,第二个连通子图包含 26 个节点,总节点度数为 132,平均节点度为 5.08,连通子图被分成了5 部分。第三个连通子图包含 18 个节点,总节点度数为90,平均节点度为5,连通子图被分成了5部分。
同现关键词网络
通过对关键词的研究,可以总结出当前的研究热点,发现研究内容之间的相关性,对研究学科发展具有重要的意义[10] 。在同现关键词网络中,将关键词作为网络的节点,如果两个关键词共同在超过5 篇文章中出现,则在这两个关键词之间建立边,然后去掉节点度为 0 的节点,最终构建出同现关键词网络。图 9 所示为对同现关键词网络执行 GN 算法后得到的社区网络。
网络中共包含 229 个节点,总节点度数为867,平均节点度数为 3.79,网络被分成了 5 部分,其中节点度数最大的两个节点分别表示关键词Genetic Algorithm 和 Software Testing,说明这两个关键词经常和其他关键词同时出现,与前文结论一致。而很多其他关键词也是围绕着这两个关键词出现,表明了这两个关键词在基于搜索的软件工程领域的重要性。
作者间共关键词网络
作者使用相同的关键词,说明他们有着共同的研究方向。通过对作者间共关键词网络的分析,对不同的作者进行社区划分,每个社区内部的作者都有大致相同的研究方向。在作者间共关键词网络中,将发表文章超过一篇的作者作为网络的节点,如果两个作者提出过至少 20 个相同的关键词,在这两个作者之间建立一条边,然后去掉节点度为 0 的节点,最终构建出作者间共关键词网络。
图 10 所示为对作者间共关键词网络执行 GN 算法后得到的社区网络。网络中包含 219 个节点,总节点度数为 572,平均节点度数为 2.61,网络被分成了 53 部分,从图中可以看出,网络比较稀疏,很多高产作者如Mark Harman、Xin Yao、Andrea Arcuri 等都不在一个社区,说明他们的研究方向不尽相同。