mapreduce中的map
- 作者: 用户17801880
- 来源: 51数据库
- 2020-10-01
引用以前看过的一个比较好好的比喻:
“你数一号书架,我数二号书架。我们人数多,数书就更快。这就是map;最后我们到一起,把所有人的统计数加在一起,就是reduce。”
关于比较专业的概念解释的话,百度百科就行了,会给你专业的回答。
reduce并不需要map全部结束后才开始运行,当一定比例的map任务结束后,reduce就开始执行,这个比例由参数mapreduce.job.reduce.slowstart.completedmaps来控制。
“你数一号书架,我数二号书架。我们人数多,数书就更快。这就是map;最后我们到一起,把所有人的统计数加在一起,就是reduce。”
关于比较专业的概念解释的话,百度百科就行了,会给你专业的回答。
reduce并不需要map全部结束后才开始运行,当一定比例的map任务结束后,reduce就开始执行,这个比例由参数mapreduce.job.reduce.slowstart.completedmaps来控制。
推荐阅读
