基于Hadoop的海量小文件存储方法的研究
时倩 方睿 岳亮 彭榆峰
随着科学技术的发展,各行业及领域需要处理的数据呈爆炸式增长。Hadoop是大文件存储处理的理想平台,但Hadoop在处理海量小文件时的表现并不令人满意。本文首先对HDFS的系统架构作了简要介绍,进而分析了HDFS处理海量小文件时存在的问题,最后介绍了目前国内外对该问题提出的优化方案。
基于Hadoop的海量小文件存储方法的研究
时间: 2025-01-30 06:45:35
基于Hadoop的海量小文件存储方法的研究
时倩 方睿 岳亮 彭榆峰
随着科学技术的发展,各行业及领域需要处理的数据呈爆炸式增长。Hadoop是大文件存储处理的理想平台,但Hadoop在处理海量小文件时的表现并不令人满意。本文首先对HDFS的系统架构作了简要介绍,进而分析了HDFS处理海量小文件时存在的问题,最后介绍了目前国内外对该问题提出的优化方案。
基于Hadoop的海量小文件存储方法的研究