采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
这个框架的设计延时过于严重,数据处理过慢是哪里的问题,spark streaming 很长时间都在缓慢处理几分钟之前的数据
我们线上就是这套架构,完全没毛病,一个分钟进来的数据在两亿条左右。你这个说慢,你看看你的flume是否慢,然后streaming消费kafka是否慢,检查streaming资源是否合理,一般不能有数据的堆积才行
非常感谢!
登录后可查看更多问答,登录/注册
Flume+Kafka+Spark Streaming 构建通用实时流处理平台
1.8k 89
1.3k 14
2.4k 13
1.8k 12
2.5k 12
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号