storm读取数据问题-慕课网

1回答

Michael_PK 2019-11-06 12:25:59

这个是否重复是需要根据storm消费后的offset的管理的，如果失败还会从上次记录的offset重新读取。当然也要自己保证处理结果的幂等性

0 回复有任何疑惑可以回复我~

提问者慕函数7570418 #1

那例如spout读取hbase的数据，那本来hbase有100条数据 他只读到80条 然后bolt里去读另外一个HBASE表的的数据 1000条 只拿到300条  预想是spout的每条数据都去和bolt拿到的每条数据对比  那理论就是 十万次  可事实他有一百万次 并且两个表的数据拿取的都不完整 一直是重复的数据 而且storm也不停下来 理应是拿完数据就等到hbase表来新的数据时在启动是吧  现在数据重复不完整 storm还一直再跑重复的数据 这种怎么处理啊

回复有任何疑惑可以回复我~ 2019-11-06 13:58:57

Michael_PK 回复提问者慕函数7570418 #2

您们这业务架构不是太了解，一般接的都是消息队列的数据比较多，因为是实时处理。

回复有任何疑惑可以回复我~ 2019-11-06 14:00:39

提问者慕函数7570418 回复 Michael_PK #3

前期暂时用sqoop将数据库中的数据放到hbase里面然后从hbase拿数据到storm处理再存到数据库中的 这样一个简便的框架。现在在storm拿数据这里一直处理重复数据 而且处理的数据完整性不能保证  也找不到相关资料  技术小白 storm都是自己看pdf的照猫画虎   走投无路

回复有任何疑惑可以回复我~ 2019-11-06 14:25:12

storm读取数据问题

正在回答

1回答

相似问题

请选择置顶位置

本课精华内容

storm本地运行正常集群运行没日志且没数据输出

老师，我使用的storm是1.1.1，kafka是1.0.0。重启worker时，数据丢失，也就是说spout没有重发数据。请问老师，这该怎么配置？非常感谢

pk哥，关于spring boot项目中的web项目无法下载依赖

storm集群运行程序数量问题

storm整合hive报错,麻烦老师您帮忙看下,是什么地方出现了问题?

热搜

最近搜索清空