HBase之Java API

来源：互联网发布：大数据概念股龙头一览编辑：程序博客网时间：2024/05/16 04:35

Table of Contents

Java API应用

Java API应用

Configuration
在使用Java API时，Client端需要知道HBase的配置环境，如存储地址，zookeeper等信息。这些信息通过Configuration对象来封装，可通过如下代码构建该对象：
Configuration config=HBaseConfiguration.create();
在调用HBaseConfiguration.create()方法时，HBase首先会在classpath下查找hbase-site.xml文件，将里面的信息解析出来封装到Configuration对象中，如果hbase-site.xml文件不存在，则使用默认的hbase-core.xml文件。
除了将hbase-site.xml放到classpath下，开发人员还可通过config.set(name, value)方法来手工构建Configuration对象：
Configuration.set(String name, String value);
HBaseAdmin
HBaseAdmin用于创建数据库表格，并管理表格的元数据信息，通过如下方法构建：
HBaseAdmin admin=new HBaseAdmin(config);
常用方法如列表所示：
Table 1. HBaseAdmin常用方法
方法名方法描述addColumn(tableName,column)为表格添加栏位deleteColumn(tableName,column)删除指定栏位balanceSwitch(boolean)是否启用负载均衡createTable(HTableDescriptor desc)创建表格deleteTable(tableName)删除表格tableExists(tableName)判断表格是否存在
Example 1. 创建表格
```
HBaseAdmin admin=new HBaseAdmin(config);  If(!admin.tableExists(“test”)){    HTableDescriptor tableDesc=new HTableDescriptor(“test”);    HColumnDescriptor cf=new HColumnDescriptor(“cf”);    tableDesc.addFamily(cf);    admin.createTable(tableDesc);}
```
指定表格名称为test。

为表格创建ColumnFamily，名称为cf。
HTable
在HBase中，HTable封装表格对象，对表格的增删改查操作主要通过它来完成，构造方法如下：
HTable table=new HTable(config,tableName);
在构建多个HTable对象时，HBase推荐所有的HTable使用同一个Configuration。这样，HTable之间便可共享HConnection对象、zookeeper信息以及Region地址的缓存信息。
Example 2. Get操作
```
Get get=new Get(rowKey);Result res=table.get(get);
```
Example 3. Put操作
```
Put put=new Put(rowKey);put.add(columnFamily,column,value);table.put(put);注：在HBase中，实体的新增和更新都是通过Put操作来实现。
```
Example 4. Delete操作
```
Delete delete=new Delete();table.delete(delete);
```
Example 5. Scan操作
```
Scan scan=new Scan( );  scan.addColumn(columnFamily,column);scan.setReversed(false); scan.setBatch(10); scan.setIsolationLevel(IsolationLevel.READ_COMMITTED); scan.setRaw(false); scan.setSmall(true); SingleColumnValueFilter filter=new SingleColumnValueFilter(          columnFamily,column,          CompareOp.EQUAL,value  );scan.setFilter(filter);  ResultScanner scanner=table.getScanner(scan);Iterator<Result> res=scanner.iterator( );
```
指定查询要返回的column。

是否为倒叙查询，可用于获取最后一条记录。

每次执行ResultScanner.next()返回多少条记录。

设置隔离级别，如果参数值为READ_UNCOMMITTED表示未提交的数据也一并读取，此时违背了读一致性(具体参考读写一致性章节)。

是否返回已经被删除的记录。

通常情况下，如果要检索的数据只存在于一个Block中，认为其是smallScan，这时将采用pread方式查询，而不是seek+read。

指定要过滤的column。

指定过滤条件。

执行扫描查找。

返回查询遍历器。
注：更多的过滤器信息请查看org.apache.hadoop.hbase.filter包。
Example 6. 遍历Result结果集
```
NavigableMap<byte[], NavigableMap<byte[], NavigableMap<Long, byte[]>>> maps = res.getMap();for(byte[] family:maps.keySet()){     System.out.println("columnFamily:"+new String(family));    for(byte[] column:maps.get(family).keySet()){         System.out.print("column:"+new String(column)+"; ");        for(Long time:maps.get(family).get(column).keySet()){             System.out.println("value:"+new String(maps.get(family).get(column).get(time)));        }    }}
```
结果集用Map封装，最外层的key为columnFamily；

第二层key为column；

第三层key为时间戳信息，value为column值。