hbase rowkey

来源:互联网 发布:淘宝店铺经营技巧 编辑:程序博客网 时间:2024/06/06 08:58

1) 三维有序

a. rowkey 行主键

b. column key 

c. timestamp 时间戳

2) 排序

按字典排序,按字节存储,字节的字典排序即是按字母的字典排序

3) 存储

每个column family 独立存储一个文件,即Store File

4) Cell 的概念

通过hbase shell scan 可以看出Cell的概念

称为KeyValue单元,包括rowkey、timestamp以及列和值

同一个Cell可以有多个版本,这多个版本降序排列,访问时最先拿到的最新的版本

5) region分布

对于单调递增的时间类型数据作为rowkey,很容易被散列到同一个region上,则会存储到同一台regionserver服务器上,这样就形成了hot spot

这时,需要调整rowkey,将数据进行散列到不同的regionserver中

6) Region拆分策略

先将region下线,然后拆分(split),将其子region加入到.META.表中,再将它们加入到regionserver中,最后汇报master

7) startkey

一个表的第一个region,它的startkey和endkey都是空,也就是说如果一个表的startkey和endkey是空,则它只有一个region


0 0
原创粉丝点击