数据密集型计算环境下离群点挖掘算法设计与实现
陈亚丽 张龙波 李彩虹 张树森 刘希昱
基于MapReduce模型,提出了一种网格技术与基于LOF方法相结合的离群点挖掘算法MR_LOF .Map阶段采用网格进行数据约简,将代表点信息发送给主节点;Reduce阶段使用基于密度的离群点挖掘算法,借助网格期望值E筛选出稠密区域.该算法只需计算稀疏区域对象的LOF值,降低了算法的时间复杂度.实验结果表明,在数据密集型计算环境中,该方法能有效的对离群点进行挖掘.
数据密集型计算环境下离群点挖掘算法设计与实现
时间: 2024-10-09 16:27:48