HBase

来源:互联网 发布:白衣服发黄 知乎 编辑:程序博客网 时间:2024/06/15 07:23

1.概念:在HDFS之上的面向列的分布式数据库,不支持SQL。
web查询:直接使用HBase的Java API、所有对表的访问都要通过表的主键。
HBase主控机master负责启动bootstrap一个全新的安装,把区域分配给注册的regionserver,恢复regionserver的故障。HBase依赖ZooKeeper。
HBase通过Hadoop文件系统API来持久化存储数据。HBase会将存储写入本地文件系统。
2.安装
挑选Apache Download Mirror(Apache下载镜像)、下载HBase的发布版本、在本地文件系统解压。% tar xzf hbase-x.y.z.tar.gz
首先要告诉HBase系统中Java在哪,设置JAVA_HOME环境变量,指向正确的Java安装,HBase使用该Java安装。
3.测试启动
启动本地文件系统/tmp目录作为持久化存储的HBase的临时实例,键入一下命令:%start-hbase-sh启动独立standalone的HBase实例。
创建表:
创建一个表”test”、使其只包含一个名为data的列,键入命令:
create ‘test’,’data’
验证表是否创建成功:list:输出用户空间的所有表
插入数据:
put ‘test’ ,’row1’,’data:1’,’value1’
关闭HBase实例:
%stop-hbase.sh
4.客户端
HBase和Hadoop都是Java开发的。
HBaseAdmin管理HBase集群,添加、丢弃表;
HTable访问指定的表;
Configuration实例讲这些指向执行这些代码的集群。
5.特性
没有真正的索引:行是顺序存储的,每行中的列也是,不会索引膨胀
自动分区,在表增长的时候,表自动分区,分布到节点上
批处理 MapReduce集成功能可以全并行处理分布式作业根据“数据的位置”来处理他们

原创粉丝点击