Hbase ：一基础知识

来源：互联网发布：微信秒杀软件电脑编辑：程序博客网时间：2024/04/28 05:32

Hadoop的两大核心：分布式存储，有HDFS来完成，存储各种格式的庞大的数据；分布式计算，使用MapReduce来处理。

Hadoop只能执行批量处理，并且只以顺序方式访问数据，这意味着即使最简单的搜索工作，必须搜索整个数据集。

以随机方式访问存储的大量数据，hadoop就会表现的很吃力和苍白。怎么办呢？

一种新的存储技术将解决此问题，它的名字叫habase；

1.hbase是建立在hadoop的HDFS之上的面向列的分布式数据库。它模仿谷歌的bigTable设计理念，可以快速随机访问海量结构化数据。同时利用HDFS提供的容错能力。

1.3 hbase的存储机制

Hbase是一个面向列的数据库。可以理解为：

表是行的集合。

行是列族的集合。

列族是列的集合。

列是键值对的集合。

1.RowKey:hbase是没有数据类型的，任何类型都可以被转换成字节数组，表中的行是通过Rowkey进行区分的。Rowkey也是唯一来确定一行的标识。表中的行是按rowkey进行排序，排序方式按字典顺序。

2.列族：列族是一些列的集合，一个列族中的所有列成员都有相同的前缀。冒号用来区分列族和列名。

3.单元格：有Rowkey，列族，列，时间戳唯一确定。每个单元格的内容是不可分割的字节数组；每个单元格都保存着同一份数据的多个版本。

参考：http://www.tuicool.com/articles/QfIbMvj

0 0

Hbase ：一 基础知识