采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
我的需求是将Hbase数据写入ES中,由于hbase是按列更新数据的,这样就要每次都需要判断_id是否存在,不存在则插入,存在则更新,并且每次都是hbase全表的量,请问老师有没有更好的办法处理呢?
如果每次是全量导,可以考虑每次都导入一个新的索引(自动生成 id),然后用别名切换的方式,这样写入性能最高。
目前就是这样处理的,但这样是所有的索引字段全部重新写入,但其实需更新的字段只是一部分,例如索引字段有2000个,但更新字段只是200-500个;意思就是行数据是全量,但字段是部分更新
如果你是更新部分字段,没有更好的办法。而且频繁更新部分字段,效率也很低的,不太推荐。
非常感谢!
登录后可查看更多问答,登录/注册
有了Elastic Stack,不用写一行代码,你也可以玩转大数据分析!
1.4k 14
1.2k 13
903 11
1.2k 11
2.5k 8