hbase export 使用小技巧
来源:互联网 发布:dedecms改cms不变 编辑:程序博客网 时间:2024/05/20 15:10
在工作中经常使用hbase的export功能来导出数据,在此总结几种小技巧:
建议导出的数据先放到hdfs上,再从hdfs上拿下来
之前经常使用如下命令进行数据备份:
hbase org.apache.hadoop.hbase.mapreduce.Export backup_table file:///opt/backup_table使用单机版做此操作是没有问题的,但是当使用多机版的hbase的时候,如果你的系统中有多个mapreduce的tasktracker。那么数据会被导出到多台机器(每个tasktracker)的local目录。
所以在使用export 命令在进行导出操作时,建议现将数据导出到hdfs中,然后再将数据从hdfs中获取下来:
# 默认不写file://的时候就是导出到hdfs上了hbase org.apache.hadoop.hbase.mapreduce.Export backup_table /tmp/backup_table hadoop dfs -get /tmp/backup_table /opt/backup_table
导出时可以限制scanner.batch的大小
如果在hbase中的一个row出现大量的数据,那么导出时会报出ScannerTimeoutException的错误。
这时候需要设置hbase.export.scaaner.batch 这个参数。这样导出时的错误就可以避免了。
hbase org.apache.hadoop.hbase.mapreduce.Export -Dhbase.export.scanner.batch=2000 backup_table /tmp/backup_table
为了节省空间可以使用compress选项
hbase的数据导出的时候,如果不适用compress的选项,数据量的大小可能相差5倍。因此使用compress的选项,备份数据的时候是可以节省不少空间的。
并且本人测试了compress选项的导出速度,和无此选项时差别不大(几乎无差别):
hbase org.apache.hadoop.hbase.mapreduce.Export -Dhbase.export.scanner.batch=2000 -D mapred.output.compress=true backup_table /tmp/backup_table
0 0
- hbase export 使用小技巧
- export LD_LIBRARY_PATH命令使用技巧
- hbase的shell小技巧
- Export/Import 使用技巧与常见错误
- 如何使用mapred export import删除hbase表数据
- hbase的export以及import工具使用练习
- hbase import & export
- Hbase export and import
- HBase数据Export & Import
- hbase根据filter export import
- google使用小技巧
- Excel使用小技巧!
- UltraEdit使用小技巧
- VI使用小技巧
- VSS 使用小技巧
- ASP使用小技巧
- winrunner使用小技巧
- js使用小技巧
- 3招解决ant构建时任务找不到(taskdef cann't be found)的问题
- 强噪声下的语音检测 VAD
- Node.js+Web TWAIN,实现Web文档扫描和图像上传
- Python装饰器与面向切面编程
- typedef
- hbase export 使用小技巧
- ARM amba总线介绍
- 如何阅读SDF文件
- 分享10个实用的jQuery代码开发小技巧
- 【学习OpenCV】CV库的调用机制
- Java编程之代码优化
- 如何在XENDESKTOP7中启用RECEIVER FOR HTML5,允许支持HTML5的浏览器访问虚拟桌面
- 理解 Objective-C 的 ARC
- 轮播 效果 可套用图片 文本 jquery