采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
输入正文
可以具体举个场景对应的例子吗? 我没太理解你这个问题的意思
就比如说,我通过kafka采集到一堆JSON数据,按照spark的思路,会使用SparkSQL对这些JSON数据直接进行筛选,那如果我将采集到的JSON数据直接将他转成List集合然后再进行筛选,这两种筛选方式使用SparkSQL的方式性能上有什么优势呢?
你的数据转成list,list是一个集合,本身并没有分布式计算的并行处理的能力。如果使用spark去处理,不管是core还是streaming还是sql,只要数据接入进来后,默认都具备分布式计算的能力的,
登录后可查看更多问答,登录/注册
实战Spark3实时处理,掌握两套企业级处理方案
2.4k 15
1.5k 15
1.7k 12
1.3k 11
1.6k 9
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号