hbase之scan的rowkey问题

来源:互联网 发布:台湾视频聊天软件 编辑:程序博客网 时间:2024/05/21 09:00

最近使用到hbase做存储,发现使用scan的时候,返回的rowkey并不是特别友好

 

例如我insert的rowkey是 xyz_123_abc

 

调用KeyValue的getKeyString方法返回的String为

 

Java代码 复制代码 收藏代码
  1. kv\x00\x0Bxyz_123_abc\x02kvobj\x00\x00\x011\xD7\xB9\xDD\x1B\x04  

 可以看到我的rowkey已经被处理过了,不过这个处理只是拼接处理,没有其他译码的过程。

 

好吧,这下需要考虑如何提取出我的真实的rowkey了,看了下KeyValue中,生成key的算法太繁琐了,直接跳过,debug看下rowkey的返回过程,发现KeyValue对象本身其实是正常的,也就是说KeyValue的toString方法其实有正常的rowkey,ok找到入口点了,直接看toString的方法

 

Java代码 复制代码 收藏代码
  1. public String toString() {   
  2.     if (this.bytes == null || this.bytes.length == 0) {   
  3.       return "empty";   
  4.     }   
  5.     return keyToString(this.bytes, this.offset + ROW_OFFSET, getKeyLength()) +   
  6.       "/vlen=" + getValueLength();   
  7.   }  

 

接着看keyToString方法,摘取最前面重要的2段

 

Java代码 复制代码 收藏代码
  1. public static String keyToString(final byte [] b, final int o, final int l) {   
  2.    if (b == nullreturn "";   
  3.    int rowlength = Bytes.toShort(b, o);   
  4.    String row = Bytes.toStringBinary(b, o + Bytes.SIZEOF_SHORT, rowlength);  
 

这次终于找到了他的构成方法了,ok 对照KeyValue的API 可以写个util方法来获取真实的rowkey字符串了

 

Java代码 复制代码 收藏代码
  1. public static String getRealRowKey(KeyValue kv) {   
  2.         int rowlength = Bytes.toShort(kv.getBuffer(), kv.getOffset()+KeyValue.ROW_OFFSET);   
  3.         String rowKey = Bytes.toStringBinary(kv.getBuffer(), kv.getOffset()+KeyValue.ROW_OFFSET + Bytes.SIZEOF_SHORT, rowlength);   
  4.         return rowKey;   
  5.     }  

 

原创粉丝点击