采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
你好,老师, spark.sql.shuffle.partitions 设置 与 repartitions (字段) 根据字段分区 这两个有什么区别吗
为什么在使用过程中,如果不修改 spark.sql.shuffle.partitions 通过字段进行分区,比如一个字段有300种类型,结果 分区还是 200,这个情况怎么解释
第一个是参数设置,第二个是在API设置的。第二个是根据指定字段重新shuffle
非常感谢!
肯定影响性能,但是有些数据倾斜就需要这个来解决
老师,这个根据字段重新分区,在实际生产中,使用的多吗?不会有不稳定的情况吧
登录后可查看更多问答,登录/注册
快速转型大数据:Hadoop,Hive,SparkSQL步步为赢
2.0k 6
2.1k 6
2.2k 1
1.5k 21
1.8k 18
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号