什么情况，导致重处理啊，为什么lamda架构不能重处理啊，都没讲？-慕课网

1回答

xiaochen 2022-10-07 23:18:32

在上一小节4-2有介绍，比如像数据出现了延迟、数据丢失进行数据的补数据，都需要进行数据的重处理。但流处理通常是作为一个常驻进程，只会启动一次，不会多次调度，对数据的重处理是很难支持的。

0 回复有任何疑惑可以回复我~

提问者学音乐的程序员 #1

kappa重处理，比如据出现了延迟、数据丢失进行数据的补数据，数据都在kafak中，怎么来补数据，补在哪里，kafka是顺序消费数据的，flink或者spark streaming怎么做的，还有重处理从什么地方开始---哪一条数据开始重处理，怎么定位

回复有任何疑惑可以回复我~ 2022-10-09 10:01:12

xiaochen 回复提问者学音乐的程序员 #2

Kafka可以指定offset或者时间戳消费数据，以Spark为例，可参考文档：https://spark.apache.org/docs/latest/structured-streaming-kafka-integration.html。

从哪条数据重处理不重要，重处理的起点可以是一个小时前、一天等等，毕竟是启动一个新的流程，最终是使用这个新的流程替换掉老的流程。

回复有任何疑惑可以回复我~ 2022-10-09 23:01:03

什么情况，导致重处理啊，为什么lamda架构不能重处理啊，都没讲？

正在回答回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

关于 ClickHouse 验证副本同步

建模问题

kibana 异常启动不了 unable to find usable node.js executable.

图上描述有误,请老师修正

课程资料中虚拟机mac用vmware启动卡在登录界面

【阶段作业】及时性检查和多数据源的值对比功能

【阶段作业】构建违规IP/域名的上下行流量聚集事实表汇总模型

【阶段作业】Spark实现分片key的自定义路由策略

【阶段作业】结合数据进行模型设计

【阶段作业】Projection的使用有哪些限制？

热搜

最近搜索清空