第 1 章 了解Hadoop MapReduce
Hadoop MapReduce性能优化
第 1 章 了解Hadoop MapReduce
MapReduce是一个流行的针对数据密集任务的分布式计算模型,它正在发展成为用来支撑包括Web索引、数据挖掘和科学仿真等领域的大规模数据并行应用的重要编程模型。
Hadoop是Google公司的MapReduce编程模型的最受欢迎的Java开源实现。在很多公司,Hadoop已经用于大规模数据分析任务,并且经常用在对响应时间要求很严格的作业中。
在深入了解MapReduce编程和Hadoop性能调优之前,我们先来回顾一下MapReduce模型的基础知识,并了解有哪些因素影响着Hadoop的性能。
本章将介绍以下内容:
- MapReduce模型;
- Hadoop MapReduce概述;
- Hadoop MapReduce的工作原理;
- 影响MapReduce性能的因素。
时间: 2024-10-01 08:46:18