采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师,广播变量 与 缓存的区别是什么
这两个建议先看下官网描述,写的很清楚
非常感谢!
我讲一下哈(别喷我啊)
广播变量可以减少各个节点间的通信,从而提高效率。
缓存我就不说了,你肯定很清楚了
正解!
其实我还想问问 如果使用broadcast 可以实现在spark 的不同application 中共享数据吗? 我简单试了一下 好像不行(一定是我的打开方式不对) 不知道 帅老师 以后会不会真的开堂课 讲这个咋实现哦?
不行的,这是单应用的广播,你如果想多应用,需要借助于第三方的框架,比如alluxio。弱弱问下你在群里吗
登录后可查看更多问答,登录/注册
使用Python3对Spark应用程序进行开发调优,掌握Azkaban任务调度
1.2k 16
1.1k 15
991 14
1.0k 12
2.3k 11