HIVE的简介
来源:互联网 发布:密码框键入数据是 编辑:程序博客网 时间:2024/06/07 05:26
What is Hive
Hive是基于Hadoop(HDFS,
MapReduce)的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。
本质是将SQL转换为MapReduce程序
Why use Hive
面临的问题:
1)人员学习成本太高
我只是需要一个简单的环境:
1)MapReduce如何搞定
2) 复杂查询好难
3) Join如何实现
为什么要使用Hive
1) 操作接口采用类SQL语法,提供快速开发的能力
2)避免了去写MapReduce,减少开发人员的学习成本
3)扩展功能很方便
Hive的特点
1) 可扩展 : Hive可以自由的扩展集群的规模,一般情况下不需要重启服务
2)延展性 : Hive支持用户自定义函数,用户可以根据自己的需求来实现自己的函数
3)容错 :良好的容错性,节点出现问题SQL仍可完成执行
Hive architecture
主要分为以下几个部分:
用户接口:包括 命令行CLI,Client,Web界面WUI,JDBC/ODBC接口等
中间件 :包括thrift接口和JDBC/ODBC的服务端,用于整合Hive和其他程序。
元数据 :metadata存储,通常是存储在关系数据库如 mysql, derby 中的系统参数
底层驱动:包括HiveQL解释器、编译器、优化器、执行器(引擎)。
Hadoop :用 HDFS 进行存储,利用MapReduce 进行计算。
Hive and Hadoop
Hive and RDBMS
0 0
- Hive+MySQL的简介
- HIVE的简介
- Hive的简介
- Hive的简介、安装配置
- Hive简介
- Hive简介
- Hive简介
- HIVE简介
- Hive简介
- Hive - 简介
- Hive简介
- Hive简介
- Hive简介
- hive简介
- Hive简介
- hive简介
- HIVE 简介
- Hive简介
- xml文件报错找不到资源(字符串、变量)解决方法(尚未解决,待续)
- iOS 推送,证书申请,本地推送
- 简单聊天界面
- gcc与make
- 3.C#多线程补充(委托Delegate)
- HIVE的简介
- Java程序StringBuilder的效率,验证字符串操作和字符串生成器的操作效率
- 一点一滴分析LinkIt™ Smart 7688 编译环境
- Leetcode #17 Letter Combinations of a Phone Number Z9键盘字母组合解题小节
- Windows上已经删除的文件并没有消失并且再次删除却提示无法找到该项目的解决办法
- ASMC(异步静态存储控制器)
- CSS实现等比例缩放的盒子
- 虚拟机centos6.6静态ip配置
- 在ScrollView下实现无论怎么滚动,toolbar始终在呈现在手机屏幕的最上方