Hbase 大表快速count
来源:互联网 发布:优酷会员淘宝不能买了 编辑:程序博客网 时间:2024/06/06 04:56
第一种比较简单,但是只适合小表进行count
1.count命令
最直接的方式是在hbase shell中执行count的命令可以统计行数。
其中,INTERVAL为统计的行数间隔,默认为1000,CACHE为统计的数据缓存。这种方式效率很低,如果表行数很大的话不建议采用这种方式。
下面两种方法可以进行大表count
2. 调用Mapreduce
这种方式效率比上一种要搞很多,调用的hbase jar中自带的统计行数的类。
1000w耗时两分钟。
3.hive over hbase
如果已经见了hive和hbase的关联表的话,可以直接在hive中执行sql语句统计hbase表的行数。
hive over hbase 表的建表语句为:
/*创建hive与hbase的关联表*/
/*hive关联已经存在的hbase*/
阅读全文
0 0
- Hbase 大表快速count
- hbase 数据迁移,表count
- hbase count
- HBase计算表的总count
- MySQL 大表的count()优化
- 二进制 快速count 1
- 二进制 快速count 1
- 东大OJ-1040-Count-快速幂方法求解斐波那契-
- Oracle 快速Drop大表
- oracle快速删除大表
- MySQL快速删除大表
- hbase快速入门--hTable
- Hbase 快速启动指南
- HBase快速查询原理
- [HBase配置参数解析]hbase.regionserver.handler.count
- HBase加载大数据
- hbase加载大数据
- HBase加载大数据
- HTML5-购物车全选--小计-
- 表示数值的字符串
- TinkPHP5 自定义分页教程
- js中click事件导致当前页面重新加载
- 为什么招聘单位都要求你有ITIL证书,你知道吗?
- Hbase 大表快速count
- function xxxxxx at 0x000001C3FFF60598 等等
- APUE第八章 进程控制
- Android6.0以上文件读写权限
- a+b
- 虚拟机Ubuntu16.04无法进入图形界面 The system is running in low-graphics mode
- hexo+github创建个人博客--基础篇
- 文章标题
- Anaconda中python安装模块命令