Hbase中多版本(version)数据获取办法

来源：互联网发布：知乎编辑：程序博客网时间：2024/06/06 18:08

前言：本文介绍2种获取列的多版本数据的方式：shell和spring data hadoop

一、hbase shell中如何获取

1、在shell端创建一个Hbase表

[java] view plain copy

2、查看表结构

[java] view plain copy

表结构如下：

[java] view plain copy

Table t1 is ENABLED
t1
COLUMN FAMILIES DESCRIPTION
{NAME => 'f1', BLOOMFILTER => 'ROW', VERSIONS => '1', IN_MEMORY => 'false', KEEP_DELETED_CELLS => 'FALSE', DATA_BLOCK_ENCODING => 'NON
E', TTL => 'FOREVER', COMPRESSION => 'NONE', MIN_VERSIONS => '0', BLOCKCACHE => 'true', BLOCKSIZE => '65536', REPLICATION_SCOPE => '0'
}
1 row(s) in 0.1370 seconds

从上面的表结构中，我们可以看到，VERSIONS为1，也就是说，默认情况只会存取一个版本的列数据，当再次插入的时候，后面的值会覆盖前面的值。

3、修改表结构，让Hbase表支持存储3个VERSIONS的版本列数据

[java] view plain copy

修改后，shell终端显示如下：

[java] view plain copy

再次查看表结构：

[java] view plain copy

Table t1 is ENABLED
t1
COLUMN FAMILIES DESCRIPTION
{NAME => 'f1', BLOOMFILTER => 'ROW', VERSIONS => '3', IN_MEMORY => 'false', KEEP_DELETED_CELLS => 'FALSE', DATA_BLOCK_ENCODING => 'NON
E', TTL => 'FOREVER', COMPRESSION => 'NONE', MIN_VERSIONS => '0', BLOCKCACHE => 'true', BLOCKSIZE => '65536', REPLICATION_SCOPE => '0'
}
1 row(s) in 0.0330 seconds

我们会发现VERSIONS已经修改成了3.

4、插入3行数据

[java] view plain copy

从上面可以看出，插入了3行数据到表中，并且3行数据的rowkey一致，然后使用get命令来获取这一行数据，发现只返回了最新的一行数据。

5、获取多行数据方法

[java] view plain copy

从上面的测试结果中，可以看出，一次性获取了3个版本的数据。

二、spring data hadoop获取多版本信息

1、服务封装如下：

[java] view plain copy

public List<String> get(final String tableName, final byte[] rowName, final String familyName,
final String qualifier) {
return htemplate.execute(tableName, new TableCallback<List<String>>() {
@Override
public List<String> doInTable(HTableInterface table) throws Throwable {
Get get = new Get(rowName);
get.setMaxVersions(3); // 设置一次性获取多少个版本的数据
get.addColumn(familyName.getBytes(), qualifier.getBytes());
Result result = table.get(get);
List<Cell> cells = result.listCells();
String res = "";
List<String> list = new ArrayList<String>();
if(null != cells && !cells.isEmpty()){
for(Cell ce:cells){
res = Bytes.toString(ce.getValueArray(),
ce.getValueOffset(),
ce.getValueLength());
System.out.println("res:"+res+" timestamp:"+ce.getTimestamp());
list.add(res);
}
}
return list;
}
});
}

2、测试

[java] view plain copy

[java] view plain copy

从上面的测试结果可以看出，同时获取了3个版本的列信息PS：spring data hadoop默认提供的接口中，是没有提供一次性获取多个版本的列信息的接口的，需要我们自己使用Hbase原生的API进行封装。具体封装方法，如上。

阅读全文

0 0