采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
这个框架的设计延时过于严重,数据处理过慢是哪里的问题,spark streaming 很长时间都在缓慢处理几分钟之前的数据
我们线上就是这套架构,完全没毛病,一个分钟进来的数据在两亿条左右。你这个说慢,你看看你的flume是否慢,然后streaming消费kafka是否慢,检查streaming资源是否合理,一般不能有数据的堆积才行
非常感谢!
登录后可查看更多问答,登录/注册
Flume+Kafka+Spark Streaming 构建通用实时流处理平台
1.7k 89
1.2k 14
2.4k 13
1.7k 12
2.4k 12