Hive学习篇2

来源:互联网 发布:锥套皮带轮锥度算法 编辑:程序博客网 时间:2024/06/05 06:34

WordCount单词统计

在开始学习编程时都要写一个Hello World程序,学习hive也一样,也要做一个wordcount单词统计。
为了做这个wordcount单词统计,我找了一篇英语短文来做测试。

首先现在hive中建一个words表,用来存储英语短文,字段自己设置,数据类型为string。



然后将英语短文内容存入words表中。



查询一下表的内容。



创建一个wordcount表,用来存储分割字符串后的单词。



将words表中的数据插入到wordcount表中,并分割字符串,在这里hive将hql解析成MapReduce任务。





hive将hql解析成MapReduce任务计算。



最后结果


0 0