一种基于MapReduce的并行聚类模型
顾瑞春 王静宇
在对海量数据进行聚类的过程中,传统的串行模式局限性越来越明显,难以在有效时间内得出满意结果的问题,本文提出一种基于Hadoop 平台下MapReduce框架的并行聚类模型。理论和实验结果证明该模型具有接近线速的加速比,针对海量数据具有较高效率。
一种基于MapReduce的并行聚类模型
时间: 2024-11-18 11:35:35
一种基于MapReduce的并行聚类模型
顾瑞春 王静宇
在对海量数据进行聚类的过程中,传统的串行模式局限性越来越明显,难以在有效时间内得出满意结果的问题,本文提出一种基于Hadoop 平台下MapReduce框架的并行聚类模型。理论和实验结果证明该模型具有接近线速的加速比,针对海量数据具有较高效率。
一种基于MapReduce的并行聚类模型