什么是Hive
来源:互联网 发布:个人考勤软件 编辑:程序博客网 时间:2024/05/18 02:55
Hive 是建立在 Hadoop 上的数据仓库基础构架。
它提供了一系列的工具,可以用来进行数据提取转化加载(ETL ),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。
Hive 定义了简单的类 SQL 查询语言,称为 QL ,它允许熟悉 SQL 的用户查询数据。
同时,这个语言也允许熟悉 MapReduce 开发者的开发自定义的 mapper 和 reducer 来处理内建的 mapper 和 reducer 无法完成的复杂的分析工作。
Hive是SQL解析引擎,它将SQL语句转译成M/R Job然后在Hadoop执行。
Hive的表其实就是HDFS的目录,按表名把文件夹分开。如果是分区表,则分区值是子文件夹,
可以直接在M/R Job里使用这些数据。
Hive 相当于hadoop的可视化工具,如Mysql的可视化工具Navicat for MySQL,
oracle的可视化工具PLSQLDeveloper,它可以起很多个,而且起不同版本的。
只要环境参数配置好了。就像Navicat for MySQL和sqldeveloper可以开多个。
Hive的数据存储基于Hadoop HDFS。
Hive没有专门的数据存储格式存储结构主要包括:数据库、文件、表、视图、索引。
Hive默认可以直接加载文本文件(TextFile),还支持SequenceFile、RCFile。
0 0
- 什么是Hive
- 什么是Hive
- 什么是Hive
- Hive 1、什么是Hive,Hive有什么用
- 让你真正明白什么是hive
- 让你真正明白什么是hive
- 让你真正明白什么是hive
- 让你真正明白什么是hive
- Hive简介、什么是Hive、为什么使用Hive、Hive的特点、Hive架构图、Hive基本组成、Hive与Hadoop的关系、Hive与传统数据库对比、Hive数据存储(来自学习资料)
- Hive
- HIVE
- Hive
- hive
- hive
- hive
- hive
- hive
- Hive
- IntelliJ IDEA 快捷键和设置
- The ultimate SO_LINGER page, or: why is my tcp not reliable
- 使用JSON在前台与后台之间进行简单的传值
- oleDBConn.ServerVersion 未注册"Microsoft.ACE.OLEDB.12.0"提供程序 或oleDBConn(0x80004005)或oleDBConn 未知错误
- 【方法】方法重载与方法重写
- 什么是Hive
- leetcode :Binary Search:Two Sum II - Input array is sorted(069)
- 《集体智慧编程》笔记2.1---第二章
- 98-7
- 使用LinearLayout+TextView实现底部导航栏,重复切换页面不会重新加载
- 【BZOJ】3016: [Usaco2012 Nov]Clumsy Cows
- Java transient关键字使用小记
- leetcode :Binary Search:Dungeon Game(174)
- 《数学之美》读书笔记3