请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

分区问题

老师,如果keyby 的时候key特别多,像几千个key,那么会有几千个分区吗?每个key都在单独的task中执行吗?这样会不会很耗资源呢?

正在回答 回答被采纳积分+3

1回答

Michael_PK 2022-11-18 16:40:49

多个key,相同的key一定在一个task。但是也有可能多个key是被分在同一个分区的。并不是说一个key就一定在一个分区。

0 回复 有任何疑惑可以回复我~
  • 提问者 吐丝蚕宝宝 #1
    如果多个key在同一个分区,通过key去count是不是就不准了?
    回复 有任何疑惑可以回复我~ 2022-11-18 16:49:26
  • Michael_PK 回复 提问者 吐丝蚕宝宝 #2
    一样准的呢。多个key在同一个分区,那么就在一个reducer中,reduce方法会被执行多次,每个key一次的。你可以走一个debug试试:就使用一个reducer,N多不同的key都是进到这个reduce,你在reducer方法上加个断点,一个key只能进去reducer方法一次的
    回复 有任何疑惑可以回复我~ 2022-11-28 00:35:11
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信