采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师你好,我想知道实际应用中,如果我想按数据中的部门的数量来创建ReducerTask的数量,这个有什么好办法。
那你按照部门字段分组,然后分区就行了
分区需要设置NumReduceTasks的数量,如果设置的数值小于实际的部门数量就输出不了结果了。因为这个部门的数量是不确定的,这个NumReduceTasks应该设置多少比较合适
这个参数除非自定义分区,不然不用设置的呢。要是自己自定义分区了,那你的业务分区数多少你自己必然知道
登录后可查看更多问答,登录/注册
从Hadoop核心技术入手,掌握数据处理中ETL应用,轻松进军大数据
1.3k 21
1.6k 20
1.4k 19
1.7k 17
3.3k 16