hbase中列簇设计

来源:互联网 发布:雀巢优麦怎么样知乎 编辑:程序博客网 时间:2024/06/01 10:00
列簇CF设计  尽量少,建议CF数量在1-2个。  设计Hbase schema的时候,要尽量只有一个column family。   flush和compaction触发的基本单位都是Region级别。当一个CF有大量的数据的时候会触发整个region里面的其他CF的memstore(其实这些memstore可能仅有少量的数据,还不需要flush的)也发生flush动作;  另外compaction触发的条件是当store file的个数(不是总的store file的大小)达到一定数量的时候会发生,而flush产生的大量store file通常会导致compaction,flush/compaction会发生很多IO相关的负载,这对Hbase的整体性能有很大影响,所以选择合适的column family个数很重要
原创粉丝点击