- 现象:之前公司调度用的azkaban,任务2周月内卡死出现次数超过一半
- 影响范围: 导致给管理层以及运营人员看的业务报表第二天迟迟发不来
- 想要达到的目标:为业务应用提供安全、可靠、稳定、舒心的服务,业务高峰时资源及时扩容,洪峰来临时,优先确保核心应用稳定,调度平台不会轻易宕机。
通过对DolphinScheduler的调研发现它在可视化,易用性,异常作业的重试以及工作流的监控相比于azkaban都表现的更好一些,如果对azkaban已经做过了二次开发,那么是否会考虑把DolphinScheduler用起来呢?