问题描述
- reduce到底是什么作用?
-
把含有相同的KEY放到一组去(shuffle)这个动作是再mapper得到中间结果之后,
copy到“多个”reduce之前做的。那“多个”reduce是干嘛的?书上说:不同的KEY分给不同的reduce。 那么间接说明了reduce的个数是由key分组后的个数决定的,那JOB的setNumReduceTasks的指定又代表了什么?如果是3种KEY,我却指定个reduce,会是什么情形?还是说这里的reduce个数和按key来分发reduce的个数毫无关系?
时间: 2024-10-25 10:09:22