请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

你好,老师, spark.sql.shuffle.partitions 设置 与 repartitions (字段) 根据字段分区 这两个有什么区别吗

你好,老师, spark.sql.shuffle.partitions 设置 与 repartitions (字段)  根据字段分区 这两个有什么区别吗

为什么在使用过程中,如果不修改 spark.sql.shuffle.partitions  通过字段进行分区,比如一个字段有300种类型,结果 分区还是 200,这个情况怎么解释

正在回答

3回答

第一个是参数设置,第二个是在API设置的。第二个是根据指定字段重新shuffle

1 回复 有任何疑惑可以回复我~
Michael_PK 2018-04-07 15:29:58

肯定影响性能,但是有些数据倾斜就需要这个来解决

1 回复 有任何疑惑可以回复我~
提问者 慕运维7479159 2018-04-07 13:24:01

老师,这个根据字段重新分区,在实际生产中,使用的多吗?不会有不稳定的情况吧

0 回复 有任何疑惑可以回复我~
问题已解决,确定采纳
还有疑问,暂不采纳
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号