Hive初探

来源:互联网 发布:泛伊斯兰主义知乎 编辑:程序博客网 时间:2024/05/31 20:51

一、什么是Hive

       Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射成一张表,并提供类SQL查询功能。  

        ##构建在Hadoop上的数据仓库

                 使用HQL作为查询接口

                 使用HDFS存储;

                 使用MapReduce计算

        ##本质是:将HQL转换成MapReduce程序

        ##HQL的核心是Engine。

      

     

二、Hive 在生态系统中的位置


三、Hive架构




四、Hive的优点和使用场景