HBase split

来源:互联网 发布:360极速浏览器 mac版 编辑:程序博客网 时间:2024/06/07 07:01

实验过程

大致步骤如下。
1 hbase中建表
2 hbase表中插入2条数据观察
3 hbase表中插入大于64M的数据观察

开始之前的HDFS结构


步骤1、2
可以用JAVA API 或者其他方法这里不做介绍了。完成步骤2后观察hdfs中目录结构如下:



从上图可以看出创建的基本结构,结合其他博客分享的文章总结步骤大致如下。
  • 在HBase目录下创建table名的文件夹
  • 在tableName文件夹下创建第一个region
  • 在region中创建family名的文件夹
  • tableName文件夹下生成compation.dir目录,用于合并-------(不知道是不是tmp这个文件夹)


步骤3 通过java API生成数据。


变化图1

变化图2

从结果分析:
1 famliy文件夹下的文件大小开始的时候是有memstore刷写到磁盘的大小,每次刷写磁盘都会产生一个新的storefile文件。
2 当storefile文件达到阀值则会进行合并压缩,压缩后文件大小小于storefile文件大小的和。
3 合并后有数据继续插入则会新生成几个storefile,达到阀值后继续合并
4 当最终单个文件在64M左右时文件大小不在发生变化。
0 0
原创粉丝点击