Apache Hive

来源:互联网 发布:占星术杀人魔法 知乎 编辑:程序博客网 时间:2024/06/06 02:20

http://hive.apache.org/

http://baike.baidu.com

hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。

Apache Hive™数据仓库软件便于使用SQL读取,写入和管理驻留在分布式存储中的大型数据集。结构可以投影到已经存储的数据上。提供了一个命令行工具和JDBC驱动程序,用于将用户连接到Hive。

HiveServer2(在Hive 0.11中引入)具有自己的CLI(command-line interface,命令行界面),称为Beeline,它是基于SQLLine的JDBC客户端

详细的的LangugeManual官网https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Cli

关于Mysql和JDBC会专门总结一下


----------------------------------------------------待更--------------------------------------------------------------------------------