Hbase :一 基础知识

来源:互联网 发布:微信秒杀软件电脑 编辑:程序博客网 时间:2024/04/28 05:32

1.1引言

Hadoop的两大核心:分布式存储,有HDFS来完成,存储各种格式的庞大的数据;分布式计算,使用MapReduce来处理。

Hadoop只能执行批量处理,并且只以顺序方式访问数据,这意味着即使最简单的搜索工作,必须搜索整个数据集。

以随机方式访问存储的大量数据,hadoop就会表现的很吃力和苍白。怎么办呢?

一种新的存储技术将解决此问题,它的名字叫habase

1.2 hbase

1.hbase是建立hadoopHDFS之上的面向列的分布式数据库。它模仿谷歌的bigTable设计理念,可以快速随机访问海量结构化数据。同时利用HDFS提供的容错能力。

1.3 hbase的存储机制

Hbase是一个面向列的数据库。可以理解为:

表是行的集合。

行是列族的集合。

列族是列的集合。

列是键值对的集合。

1.4 HBASe模型概念

 

1.RowKey:hbase是没有数据类型的,任何类型都可以被转换成字节数组,表中的行是通过Rowkey进行区分的。Rowkey也是唯一来确定一行的标识。表中的行是按rowkey进行排序,排序方式按字典顺序。

2.列族:列族是一些列的集合,一个列族中的所有列成员都有相同的前缀。冒号用来区分列族和列名。

3.单元格:Rowkey,列族,列,时间戳唯一确定。每个单元格的内容是不可分割的字节数组;每个单元格都保存着同一份数据的多个版本。

参考 :http://www.tuicool.com/articles/QfIbMvj

 

1.5 HbaseHDFS,RDBMS的比较

 

 

 

 

0 0
原创粉丝点击