1.map写到buffer时候,预排序(为了后面的快排)
2.spill的时候二次快排
3.再根据partioner排序,每个partioner里根据key排序
4.在Map 任务完成前,所有的spill 文件将会被归并排序为一个索引文件和数据文件
5. 当所有的Map 输出都被拷贝后,Reduce 任务进入排序阶段(更恰当的说应该是归并阶段,因为排序在Map 端就已经完成),这个阶段会对所有的Map 输出进行归并排序,这个工作会重复多次才能完成
大概有5个排序
查看本栏目更多精彩内容:http://www.bianceng.cnhttp://www.bianceng.cn/webkf/tools/
时间: 2024-11-17 06:10:31