Hive的安装模式、体系架构及优点

来源:互联网 发布:软件项目管理实例 编辑:程序博客网 时间:2024/06/05 12:48

一、Hive的安装模式


Hive有三种安装模式,分别是:嵌入模式、本地模式和远程模式。

1.1 嵌入模式
(1)元数据信息被保存在自带的Deybe数据中
(2)只允许创建一个连接
(3)多用于Demo

1.2 本地模式
(1)元数据信息被保存在MySQL数据库
(2)MySQL数据库与Hive运行在同一台物理机器上
(3)多用于开发和测试

1.3 远程模式
(1)元数据信息被保存在MySQL数据库
(2)MySQL数据库于Hive运行在不同的物理机器上
(3)用于实际生产环境

二、Hive的体系架构及优点



Hive优点与使用场景:

(1)操作接口采用类SQL语法,提供快速开发的能力(简单、容易上手);

(2)避免了去写MapReduce,减少开发人员的学习成本;

(3)统一的元数据管理,可与impala/spark等共享元数据;

(4)易扩展(HDFS+MapReduce:可以扩展集群规模;支持自定义函数);

(5)数据的离线处理;比如:日志分析,海量结构化数据离线分析...

(6)Hive的执行延迟比较高,因此Hive常用于数据分析的、对实时性要求不高的场合;

(7)Hive优势在于处理大数据,对于处理小数据没有优势,因为Hive的执行延迟比较高。

原创粉丝点击