请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

流处理如何按某个用户某个小时聚合再入库

视频中的案例,是每次日志过来都计算,然后都入库。
如果某个用户每个小时可能有N条日志数据过来,怎么按小时做持续汇总,再持续更新到库里?相当于每个用户每小时在库里只允许有1条数据

正在回答 回答被采纳积分+3

1回答

Michael_PK 2022-08-11 21:20:42

1)数据清洗后入库,然后按照每个小时每个用户 去做统计处理

2)可以是用window开一个窗口进行处理

0 回复 有任何疑惑可以回复我~
  • 提问者 燃着的半支烟 #1
    如果想多条处理结果做汇总呢?只能用state 吗?
    回复 有任何疑惑可以回复我~ 2022-08-11 22:15:41
  • Michael_PK 回复 提问者 燃着的半支烟 #2
    带state是一种方式,也可以把数据清洗后直接落在某种数据库中,然后后续直接使用sql进行统计也是可以的呢,这种方式一定要基于eventtime来出来,不然不能保证数据的一次消费
    回复 有任何疑惑可以回复我~ 2022-08-14 23:30:43
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信