hive简介--hive初步认识
来源:互联网 发布:程序员怎么抢游戏号 编辑:程序博客网 时间:2024/05/17 07:14
Hive:
hive简介:
Hive是基于hadoop的一个数据仓库基础架构,通过将结构化数据文件映射为一张数据库表,并提供简单的SQL查询功能,提供数据仓库的统计分析。Hive可以将SQL转化为MapReduce任务执行。Hive本身不存储数据,文件数据存储在hadoop兼容的文件系统中。Hive只保存元数据信息。Hive在数据加载过程中不会对数据进行任何的修改,只是将数据移动到hdfs中Hive指定的目录下。因此,Hive不支持对数据的修改和添加,所有数据都是加载的时候确定的,在读取的时候进行校验。Hive主要有一下特点:
1、支持索引,加快查询速度
2、支持多种存储类型
3、元数据信息保存在数据库中
4、可以直接使用hdfs文件系统中的数据
5、内置UDF韩式,用户可以自定义UDF函数
Hive支持的数据类型:
hive支持基本数据类型和复杂数据类型两种数据类型:
基本数据类型:
Integers:
TINYINT - 1 byte
SMALLINT - 2 byte
INT - 4 byte
BIGINT - 8 byte
BOOLEAN:
BOOLEAN - TRUE/FALSE
Floating point numbers:
FLOAT –单精度
DOUBLE – 双精度
String:
STRING - sequence of characters in a specified character set
复杂数据类型:
Structs: 例子 {c INT; d INT}
Maps (key-value tuples):. 例子'group' -> gid M['group']
Arrays (indexable lists): 例子[‘1', ‘2', ‘3']
TIMESTAMP 0.8版本新加属性
阅读全文
0 0
- hive简介--hive初步认识
- 认识Hive
- 深入浅出hive-hive简介
- #Hive#Hive的一点认识
- hive学习之一:认识hive
- Hive搭建(认识Hive)
- Hive简介
- Hive简介
- Hive简介
- HIVE简介
- Hive简介
- Hive - 简介
- Hive简介
- Hive简介
- Hive简介
- hive简介
- Hive简介
- hive简介
- C++发展及程序员基本功
- 剑指Offer--二维数组的查找
- 一个图片处理工具类
- PHP-sftp文件上传
- android简单获取开发版sha1以及发布版sha1值
- hive简介--hive初步认识
- 剑指Offer-斐波那契数列以及跳台阶问题
- React Native 使用Redux全局共享state
- oracle创建表空间和用户
- 解析程序包出现问题(更新下载apk)
- Idea+tomcat-每次修改JS文件都需要重启tomcat才能生效解决方法
- cocos 2d-x 学习日记2017年10月26
- 正则表达式-匹配标点符号
- 阿里云服务器通过ip不能访问