采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师,我不太理解这个rowkey设计的思路,rowkey的设计目的是为了数据能够尽量均匀分配到各个regionserver,按照课程里设计: day+crc32(referer+url+ip+ua) 虽然可能是满足了唯一性,但是要怎么确定这个设计满足了结合业务查询的需要?还有为什么hbase已经设计为一天一个表,但是rowkey还要加上day呢?
你说的这种是有些许可能性的,你可以再继续加时间戳进去吗,同一时间点同一ip,就更精准了
rk的设计是为了scan的时候能给更快,我们这里加了个时间在前面,那么在查找的时候直接可以通过开头的时间去扫描到
可是一个表就是一天的呀,为啥还要通过时间前缀确定呢?然后day后面那串crc32编码串是怎么能快速找到对应的数据呢?
学东西别学死,这里是为了让大家好掌握,因为我不太清楚大家都hbase基础咋样,HBASE能承载的数据量是很大的,完全可以把数据都写到一个表里,那么数据都在一个表,如何才能更快scan呢?那不就是rk设计了呢
32编码查询的时候不需要的呢,查的时候根据rk就能定位到我们所需要的哪天的所有数据了
登录后可查看更多问答,登录/注册
大数据生态圈实用框架(Spark/Hbase/Redis/Hadoop)整合应用及调优
1.4k 21
911 11
1.8k 11
1.2k 11
1.5k 11