请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

什么情况,导致重处理啊,为什么lamda架构不能重处理啊,都没讲?

什么情况,导致重处理啊,为什么lamda架构不能重处理啊,都没讲?

正在回答 回答被采纳积分+3

1回答

xiaochen 2022-10-07 23:18:32

在上一小节4-2有介绍,比如像数据出现了延迟、数据丢失进行数据的补数据,都需要进行数据的重处理。 但流处理通常是作为一个常驻进程,只会启动一次,不会多次调度,对数据的重处理是很难支持的。


0 回复 有任何疑惑可以回复我~
  • 提问者 学音乐的程序员 #1
    kappa重处理,比如据出现了延迟、数据丢失进行数据的补数据,数据都在kafak中,怎么来补数据,补在哪里,kafka是顺序消费数据的,flink或者spark streaming怎么做的,还有重处理从什么地方开始---哪一条数据开始重处理,怎么定位
    回复 有任何疑惑可以回复我~ 2022-10-09 10:01:12
  • xiaochen 回复 提问者 学音乐的程序员 #2
    Kafka可以指定offset或者时间戳消费数据,以Spark为例,可参考文档:https://spark.apache.org/docs/latest/structured-streaming-kafka-integration.html。
    
    从哪条数据重处理不重要,重处理的起点可以是一个小时前、一天等等,毕竟是启动一个新的流程,最终是使用这个新的流程替换掉老的流程。
    回复 有任何疑惑可以回复我~ 2022-10-09 23:01:03
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信