从无到有系列之Hive-入门操作及简单应用02

来源:互联网 发布:快压mac版 编辑:程序博客网 时间:2024/05/01 20:42

本文是给有一定linux基础的童鞋看的,如果读者是完全没有基础的话,建议转参考别的文章。

1.首先我们创建一个普通的文本文件,里面只有一行数据,该行也只存储一个字符串,命令如下:

echo  ‘wangjian’ > /home/hadoop/test.txt
2.然后我们建一张hive的表:
hive –e “create table test (valuestring)“;
3.接下来加载数据:
Load data local inpath ‘/home/hadoop/test.txt’ overwriteintotable test  (注:这里的inpath是相对当前用户根目录的相对路径,例如如果本身就是hadoop用户登录的,则直接text.txt即可;
关键字[OVERWRITE]意思是是覆盖原表里的数据,不写则不会覆盖。
关键字[LOCAL]是指你加载文件的来源为本地文件,不写则为hdfs的文件。)
4.最后我们查询下表:
hive –e ‘select*fromtest’;  是否查到了刚才写入的内容呢
5.我们查看一下mysql的TBLS表中是否插入了刚才表test的元数据
登录mysql,执行use hive  , select * from TBLS;
6.查看hdfs的warehouse中是否load了刚才的结构化数据信息,这里我的是 hadoop dfs -ls /user/hive/warehouse/test,可以查看到有刚才的test.txt文件
7.更详细的操作,请参考
http://blog.csdn.net/wacthamu/article/details/40744217
关于 hive 语言的详细语法可参考官方 wiki 的语言手册

http://wiki.apache.org/hadoop/Hive/LanguageManual





本系列会持续更新,希望对大家有所帮助,大家的阅读量是我持续更新的动力,希望大家关注我,谢谢阅读。



0 0
原创粉丝点击