采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
1: spark作业一个客户端,提交作业到yarn上运行,只要保证yarn的ha就可以了。 这个不是spark的ha,spark ha是针对spark standalone模式来说的。 不会一起使用
2: 对的,就是hadoop ha,然后调度到yarn上运行就可以了
是使用Azkaban执行批处理吗? 如果一个任务半个小时执行一次,是在Azkaban上配置半小时执行,还是全体执行在代码里设置Minutes(30)呢? Azkaban也需要搭建HA吗?
Azkaban是调度框架,不是批处理,是通过Azkaban把批处理作业调度起来 Azkaban生产上肯定要HA的
登录后可查看更多问答,登录/注册
从Hadoop核心技术入手,掌握数据处理中ETL应用,轻松进军大数据
1.3k 21
1.6k 20
1.4k 19
1.6k 17
3.3k 16