请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

词频统计的reduce个数

图片描述
老师我们这里没有自定义Partitioner,那么我们通过默认的return (key.hashCode() & Integer.MAX_VALUE) % numReduceTasks来定义分区数来将key相同的map转发到不同分区进行处理,按道理返回应该不止一个分区为啥输出的文件是一个呢,难道return (key.hashCode() & Integer.MAX_VALUE) % numReduceTasks这个默认计算出来的值都是一样的?我在JDK源码debug没有debug出来。

正在回答

插入代码

1回答

Michael_PK 2019-08-23 11:54:52

因为你数据量少,默认就是一个reduce

0 回复 有任何疑惑可以回复我~
  • 提问者 Panda_io #1
    明白了,谢谢老师!
    回复 有任何疑惑可以回复我~ 2019-08-24 21:21:01

相似问题

登录后可查看更多问答,登录/注册

问题已解决,确定采纳
还有疑问,暂不采纳
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号