1#HBase入门(待续)

来源:互联网 发布:spring源码视频 编辑:程序博客网 时间:2024/06/13 04:46
HBase 术语
主键(row key)
用来检索记录的主键
访问HBase表中的行 只有三种方式
  ---通过单个row key 访问
  ----通过row key 的range
  ----全表扫描
主键可以为任意的字符串

列族(column family)
列族在创建表的时候声明,一个列族可以包含多个列,列中的数据都是以二进制形式存在,没有数据类型
列族是一些列的集合
一个列族所有列成员是有着相同的前缀。比如:列courses:histor  courses:math都是列族courses的成员 :是分割符,用来区分前缀和列名

时间戳和存储单元 (timestamp and cell)
'HBase 中通过row 和 columns确定的为一个存储单元称为cell。每个cell都保存
同一份数据的多个版本。
在写入数据时,时间戳可以用HBase自动赋值(当前系统时间精确到毫秒)也可以显示赋值
每个cell中不同版本的数据按照时间的倒序排列
{row,column,version}元祖就是一个HBase中的一个cell



HBase存储细节
每个列族存储在HDFS上的一个单独的文件夹中
key和version number 会在没一个列族中存储一份
空值不会被保存






0 0