基于分布式的K-prototypes算法设计
李兴
聚类算法已经在很多领域有着广泛的应用,对于大多数的数据集,其中的属性不完全是数值型的,这就给聚类带来了困难。K-Prototypes算法的出现,解决了混合型属性聚类的困难,但其计算重复繁琐,给编程人员带来了大量的困难。Hadoop分布式系统的出现,给编写并行化的K-Prototypes算法提供了可能,这就能提高程序的并行化从而大幅度提高程序的效率。文章正是在此技术前提下,设计的并行化程序。
基于分布式的K-prototypes算法设计
时间: 2024-08-03 12:34:15