采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师,为什么删除MySQL数据的操作是在每个分区里面进行的?这样的话,不会把前面分区已经插入的数据再次删除吗?
你理解不对,这是是这个意思,如果你的作业重跑了,你原有的结果不删的话,那最终结果肯定就错了。这里体现的是幂等性
老师,我知道这个删除操作是为了重跑的时候先将原来mysql对应天的数据先删除,避免重复。我的意思是这个删除操作在rdd的每个partition里面执行,会不会有什么问题?
我明白你的意思了,放到这里执行只有一个可能是对的,那就是只有一个分区,不然这地方是写的不严谨会导致结果被误删
你的想法是对的
登录后可查看更多问答,登录/注册
大数据生态圈实用框架(Spark/Hbase/Redis/Hadoop)整合应用及调优
1.7k 21
1.3k 11
2.2k 11
1.6k 11
1.8k 11
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号