什么是Hive

来源:互联网 发布:qq游戏端口是多少 编辑:程序博客网 时间:2024/04/30 22:03

Hive是建立在Hadoop HDFS上的数据仓库基础架构

Hive可以用来进行数据提取转化加载(ETL)

Hive定义了简单的类似SQL查询语言,称为HQL它允许熟悉SQL的用户查询数据

Hive允许熟悉MapReduce开发者的开发自定义的mapper和reducer来处理内建的mapper和reducer无法完成的复杂的分析工作

Hive是SQL解析引擎,他将SQL语句转移成M/R JOB然后在Hadoop执行

Hive的表其实就是HDFS的目录/文件




0 0