HBase之Java API

来源:互联网 发布:大数据概念股龙头一览 编辑:程序博客网 时间:2024/05/16 04:35

Table of Contents

Java API应用

Java API应用

  1. Configuration

    在使用Java API时,Client端需要知道HBase的配置环境,如存储地址,zookeeper等信息。这些信息通过Configuration对象来封装,可通过如下代码构建该对象:

    Configuration config=HBaseConfiguration.create();

    在调用HBaseConfiguration.create()方法时,HBase首先会在classpath下查找hbase-site.xml文件,将里面的信息解析出来封装到Configuration对象中,如果hbase-site.xml文件不存在,则使用默认的hbase-core.xml文件。

    除了将hbase-site.xml放到classpath下,开发人员还可通过config.set(name, value)方法来手工构建Configuration对象:

    Configuration.set(String name, String value);

  2. HBaseAdmin

    HBaseAdmin用于创建数据库表格,并管理表格的元数据信息,通过如下方法构建:

    HBaseAdmin admin=new HBaseAdmin(config);

    常用方法如列表所示:

    Table 1. HBaseAdmin常用方法

    方法名方法描述addColumn(tableName,column)为表格添加栏位deleteColumn(tableName,column)删除指定栏位balanceSwitch(boolean)是否启用负载均衡createTable(HTableDescriptor desc)创建表格deleteTable(tableName)删除表格tableExists(tableName)判断表格是否存在

    Example 1. 创建表格

    HBaseAdmin admin=new HBaseAdmin(config);  If(!admin.tableExists(“test”)){    HTableDescriptor tableDesc=new HTableDescriptor(“test”);1    HColumnDescriptor cf=new HColumnDescriptor(“cf”);    tableDesc.addFamily(cf);2    admin.createTable(tableDesc);}

    1

    指定表格名称为test。

    2

    为表格创建ColumnFamily,名称为cf。


  3. HTable

    在HBase中,HTable封装表格对象,对表格的增删改查操作主要通过它来完成,构造方法如下:

    HTable table=new HTable(config,tableName);

    在构建多个HTable对象时,HBase推荐所有的HTable使用同一个Configuration。这样,HTable之间便可共享HConnection对象、zookeeper信息以及Region地址的缓存信息。

    Example 2. Get操作

    Get get=new Get(rowKey);Result res=table.get(get);

    Example 3. Put操作

    Put put=new Put(rowKey);put.add(columnFamily,column,value);table.put(put);注:在HBase中,实体的新增和更新都是通过Put操作来实现。

    Example 4. Delete操作

    Delete delete=new Delete();table.delete(delete);

    Example 5. Scan操作

    Scan scan=new Scan( );  scan.addColumn(columnFamily,column);1scan.setReversed(false); 2scan.setBatch(10); 3scan.setIsolationLevel(IsolationLevel.READ_COMMITTED); 4scan.setRaw(false); 5scan.setSmall(true); 6SingleColumnValueFilter filter=new SingleColumnValueFilter(          columnFamily,column,7          CompareOp.EQUAL,value8  );scan.setFilter(filter);  ResultScanner scanner=table.getScanner(scan);9Iterator<Result> res=scanner.iterator( );10

    1

    指定查询要返回的column。

    2

    是否为倒叙查询,可用于获取最后一条记录。

    3

    每次执行ResultScanner.next()返回多少条记录。

    4

    设置隔离级别,如果参数值为READ_UNCOMMITTED表示未提交的数据也一并读取,此时违背了读一致性(具体参考读写一致性章节)。

    5

    是否返回已经被删除的记录。

    6

    通常情况下,如果要检索的数据只存在于一个Block中,认为其是smallScan,这时将采用pread方式查询,而不是seek+read。

    7

    指定要过滤的column。

    8

    指定过滤条件。

    9

    执行扫描查找。

    10

    返回查询遍历器。


    注:更多的过滤器信息请查看org.apache.hadoop.hbase.filter包。

    Example 6. 遍历Result结果集

    NavigableMap<byte[], NavigableMap<byte[], NavigableMap<Long, byte[]>>> maps = res.getMap();for(byte[] family:maps.keySet()){ 1    System.out.println("columnFamily:"+new String(family));    for(byte[] column:maps.get(family).keySet()){ 2        System.out.print("column:"+new String(column)+"; ");        for(Long time:maps.get(family).get(column).keySet()){ 3            System.out.println("value:"+new String(maps.get(family).get(column).get(time)));        }    }}

    1

    结果集用Map封装,最外层的key为columnFamily;

    2

    第二层key为column;

    3

    第三层key为时间戳信息,value为column值。


原创粉丝点击