采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师我们这里没有自定义Partitioner,那么我们通过默认的return (key.hashCode() & Integer.MAX_VALUE) % numReduceTasks来定义分区数来将key相同的map转发到不同分区进行处理,按道理返回应该不止一个分区为啥输出的文件是一个呢,难道return (key.hashCode() & Integer.MAX_VALUE) % numReduceTasks这个默认计算出来的值都是一样的?我在JDK源码debug没有debug出来。
因为你数据量少,默认就是一个reduce
明白了,谢谢老师!
登录后可查看更多问答,登录/注册
从Hadoop核心技术入手,掌握数据处理中ETL应用,轻松进军大数据
1.4k 21
1.7k 20
1.5k 19
1.7k 17
3.4k 16
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号