rowkey的设计问题-慕课网

2回答

慕沐6014767 2022-05-17 23:06:55

这样好像做不到唯一性吧，假如有数据的这几个字段都一样的话，那行键也相同了

0 回复有任何疑惑可以回复我~

Michael_PK #1

你说的这种是有些许可能性的，你可以再继续加时间戳进去吗，同一时间点同一ip，就更精准了

回复有任何疑惑可以回复我~ 2022-05-21 10:21:06

Michael_PK 2020-09-13 15:53:44

rk的设计是为了scan的时候能给更快，我们这里加了个时间在前面，那么在查找的时候直接可以通过开头的时间去扫描到

0 回复有任何疑惑可以回复我~

收起回答

提问者哆啦A梦爱学习吖 #1

可是一个表就是一天的呀，为啥还要通过时间前缀确定呢？然后day后面那串crc32编码串是怎么能快速找到对应的数据呢？

回复有任何疑惑可以回复我~ 2020-09-13 15:59:09

Michael_PK 回复提问者哆啦A梦爱学习吖 #2

学东西别学死，这里是为了让大家好掌握，因为我不太清楚大家都hbase基础咋样，HBASE能承载的数据量是很大的，完全可以把数据都写到一个表里，那么数据都在一个表，如何才能更快scan呢？那不就是rk设计了呢

回复有任何疑惑可以回复我~ 2020-09-13 16:00:47

Michael_PK 回复提问者哆啦A梦爱学习吖 #3

32编码查询的时候不需要的呢，查的时候根据rk就能定位到我们所需要的哪天的所有数据了

回复有任何疑惑可以回复我~ 2020-09-13 16:01:28

点开查看后面1条评论

rowkey的设计问题

正在回答回答被采纳积分+3

2回答

相似问题

请选择置顶位置

本课精华内容

java.lang.NoSuchMethodError错误

java.lang.OutOfMemoryError: Java heap space错误

IDEA 无法访问远程虚拟机的datanode拿到数据

关于虚拟机设置机器名

编译支持hadoop2.6.0-cdh5.15.1的spark3.0.0失败

【讨论题】简历项目问题

【讨论题】数据倾斜的思考

【讨论题】SparkStreaming对接Kafka数据在项

【讨论题】Spark OOM问题

【讨论题】关于Spark RDD核心算子的思考

热搜

最近搜索清空