请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

怎么量化flume + kafka带来的性能提升

PK老师好,因为求职简历里不仅需要写用到了哪些技术栈最好还要写出由此提高了多少性能,我有一个采集嵌入式设备多个节点数据并进行处理的任务,项把它升级为这门课里讲的flume+kafka+spark streaming的处理架构,那我应该怎么量化由此得到的性能提升呢(例如提高throughput, 降低latency), 我觉得需要测试用flume+kafka+spark streaming之前的throughput和用之后的throughput,但不知道应该怎样科学的设计实验得到使人信服的结论并写到简历上,老师可否指点下思路,谢谢老师!

正在回答

插入代码

1回答

Michael_PK 2019-09-18 14:32:32

对于流处理系统来说,给你几个思路,你参考下:
1:整个链路如何保证数据不丢失,以及如何监控。2:kafka offset如何管理。3)流处理完kafka的数据,如果kafka的数据处理多次,那么如何保证存储结果只有一次,否则数据就重复了。 4)背压。这些是不管使用什么流处理框架,都是必须要关注的,这些必然是简历上要体现的

2 回复 有任何疑惑可以回复我~
  • 提问者 慕的地1451657 #1
    谢谢老师的解答,4)背压指的是throughput吗?还有采用这个框架可以降低latency吗?我是不是该把降低latency从简历中去掉,谢谢老师!
    回复 有任何疑惑可以回复我~ 2019-09-19 01:19:33
  • Michael_PK 回复 提问者 慕的地1451657 #2
    backpress
    回复 有任何疑惑可以回复我~ 2019-09-19 11:45:59
  • 提问者 慕的地1451657 回复 Michael_PK #3
    好的,谢谢老师的解答!
    回复 有任何疑惑可以回复我~ 2019-09-20 15:43:08
问题已解决,确定采纳
还有疑问,暂不采纳
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号