es数据同步和数据滞后问题-慕课网

1回答

龙虾三少 2019-11-05 22:53:39

canal主要是处理变化的增量数据的管道从无到有的数据不适合canal 需要用全量索引覆盖构建的方法然后说数据同步时间差的问题是避免不了的真实的环境中同步时间差甚至是毫秒级别就算是这样即便出现列表页有点进去下架了其实淘宝之类的产品也都有这个问题属于正常的解决方案

0 回复有任何疑惑可以回复我~

提问者慕桂英6345398 #1

感谢老师的回答。整个全量和增量的流程我大概想法如下：将相关表的全量数据同步到另外一个库，然后利用 spark 进行 etl 并写入 es。增量利用 canal，选择全量导出前的时间（这里不知道能不能指定时间，如果不行，如何补充全量导入期间出现的变动？），然后开始增量更新。

回复有任何疑惑可以回复我~ 2019-11-06 00:15:11

龙虾三少 #2

增量的特点是可以重复搞 即便全量搞过了 增量也可以覆盖 没必要强求时间分割

回复有任何疑惑可以回复我~ 2019-11-06 00:23:23

提问者慕桂英6345398 回复龙虾三少 #3

意思是，只要全量之前开启了 binlog，那全量后的增量就可以从 binlog 中找到全量期间数据的变化更新到 es？（在不停服务时全量同步数据，期间数据会被修改嘛）

回复有任何疑惑可以回复我~ 2019-11-06 09:15:03

es数据同步和数据滞后问题