Hbase-简介-小结

来源:互联网 发布:淘宝卖家登陆 编辑:程序博客网 时间:2024/06/01 23:07

大数据时代的数据非常重要,都具有价值

Hbase是一个分布式的、面向列的开源数据库。技术思想来源‘BigTable’论文,不同一般RDBMS适合非结构化数据存储的数据库,基于列。
为什么需要Hbase?

  1. 关系数据库系统已无法适应大型分布式数据存储的需要
  2. 改良的关系数据库(副本、分区等)难于安装和维护
  3. 关系模型对数据的操作使数据的存储变得复杂

Hbase在设立之初就为扩展做好了充分准备(加入存储节点),使用表的概念
Hbase是架构在Hadoop上的,hbase可以单独使用(只做存储),也可以与Hadoop无缝集成(存放在Hbase的数据可直接通过Hadoop分析),分析结果直接写入Hbase
HDFS是一个存储空间
Hbase是一个内存数据库,Hbase中的表,索引等是存在HDFS之上的(所有数据文件都存在HDFS上)
应用场景

  1. 大数据量且快速随机访问
  2. 数据容量横向扩展
  3. 业务场景简单,不需要关系数据库中的很多特性(事务、连接)
  4. 需高吞吐量
  5. 存结构化和半结构化、非结构化数据

Hbase的问题
不支持二级索引
服务是单点的,单台机器宕机后在master恢复它期间它所负责的部分数据将无法恢复
运维上没有关系数据库,成熟,稳定

原创粉丝点击