Hadoop集群下的并行克隆代码检测
叶林 姚国祥
克隆代码会导致项目的维护困难,削弱项目的健壮性,并且克隆代码中所包含的 bug 会破坏整个项目。当前克隆代码检测技术或者拘泥于只能检测少数几种克隆代码,或者需要极高的检测时间。而且如果需要检测大量的源代码,一台机器的主存也许无法存储所有的信息。对克隆代码检测技术的并行运行进行了可能性研究,使用基于程序依赖图的克隆代码检测技术,这种技术不仅可以检测出语法上的克隆,也可以检测出语义上的克隆,提出了一个并行子图同构检测方法并使用 MapRe-duce 并行实现,实验结果极大地提高了该方法的运行速度。
Hadoop集群下的并行克隆代码检测
时间: 2024-09-24 17:46:45