Hive 简单介绍

来源:互联网 发布:淘宝卖家怎么查看投诉 编辑:程序博客网 时间:2024/06/04 19:48

官网的介绍:The Apache Hive ™ data warehouse software facilitates reading, writing, and managing large datasets residing in distributed storage using SQL. 大意是Hive数据仓库实现了利用SQL对分布式数据库的查询和管理。


Hive出现原因:mapreduce程序开发太过麻烦,实现一个简单的wordcount都需要写几个类,而且大多数时候实现一个业务逻辑需要设计多个mapreduce程序,这种开发是很困难的。Hive的出现解决了这个问题,它将mapreduce具体实现封装起来,使得用户可以使用SQL语言对分布式存储的数据进行处理,如下图。也正是因为Hive的出现,促使Hadoop框架得到了广泛应用。



 Hive替代品:implala, spark shark, spark sql等


0 0
原创粉丝点击