Hadoop学习笔记(11)-搭建Hive伪分布式及简单操作
来源:互联网 发布:移动网络运营商是哪个 编辑:程序博客网 时间:2024/05/29 07:22
1.下载Hive
http://hive.apache.org/downloads.html
从该网址下载hive。我下载的是hive-2.1.0版本
之后用tar命令解压,我是解压到/usr/local/hadoop目录下。
2.配置环境变量
进入.bashrc 修改hive环境变量。
vim ~/.bashrc
在最后加入:
export HIVE_HOME=/usr/local/hadoop/apache-hive-2.1.0-binexport PATH=$HIVE_HOME/bin:$PATH
3.在HDFS上创建Hive文件目录
先开启hadoop
$ $HADOOP_HOME/bin/hadoop fs -mkdir /tmp$ $HADOOP_HOME/bin/hadoop fs -mkdir /user/hive/warehouse$ $HADOOP_HOME/bin/hadoop fs -chmod g+w /tmp$ $HADOOP_HOME/bin/hadoop fs -chmod g+w /user/hive/warehouse
5.启动Hive Shell
6.HiveSQL操作简介
1.1 DDL语句
创建表pokes,有两类属性foo(int型),和bar(string型):
hive> CREATE TABLE pokes (foo INT, bar STRING);
创建表invites,通过ds属性来做分区:
hive> CREATE TABLE invites (foo INT, bar STRING) PARTITIONED BY (ds STRING);
显示已经有的所以表:
hive> SHOW TABLES;OKinvitespokesTime taken:0.159 seconds,Fetched:2 row(s)
显示已S结尾的表:
hive> SHOW TABLES '.*s';
显示表invites的信息:
chive> desc invites;OKfoo int bar string ds string # Partition Information # col_name data_type comment ds string Time taken: 0.171 seconds, Fetched: 8 row(s)
给pokes表添加新列:
hive> ALTER TABLE pokes ADD COLUMNS (new_col INT);
更多详细内容见:
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL
6.2 DML语句
加载数据
hive> LOAD DATA LOCAL INPATH './examples/files/kv1.txt' OVERWRITE INTO TABLE pokes;
更多详细内容见:
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DML
6.3 SELECT查询语句
hive> SELECT a.foo FROM invites a WHERE a.ds='2008-08-15';
更多详细内容见:
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Select
7HiveSQL实验
还是来做个小实验把。更多内容见官网实验例子:
https://cwiki.apache.org/confluence/display/Hive/GettingStarted#GettingStarted-DDLOperations
8.Hive JDBC编程接口
参见下链接:
Hive编写MapReduce程序(这里笔者还没有实验过)
http://blog.csdn.net/magina507/article/details/51649890
- Hadoop学习笔记(11)-搭建Hive伪分布式及简单操作
- Hadoop学习笔记(9)-搭建Hbase伪分布式及简单操作
- Hadoop学习笔记(3)-搭建Hadoop伪分布式
- Hadoop学习笔记-----伪分布式搭建
- Hadoop学习笔记_伪分布式搭建
- Hadoop学习笔记之Hadoop伪分布式环境搭建
- Hadoop学习笔记一(hadoop伪分布式搭建)
- Hadoop学习笔记-2.Linux上搭建hadoop伪分布式
- Hadoop学习笔记1:伪分布式环境搭建
- Hadoop学习笔记1:伪分布式环境搭建
- hadoop学习笔记-hive安装及操作
- Hadoop学习笔记_Ubuntu下伪分布式安装及配置
- Hadoop简单入门之伪分布式搭建
- Hadoop伪分布式搭建操作步骤指南
- 伪分布式Hadoop及开发环境搭建(一)
- 伪分布式Hadoop及开发环境搭建(二)
- 伪分布式Hadoop及开发环境搭建(三)
- Hadoop学习笔记(5)-搭建Hadoop分布式
- JavaScript学习笔记(2)
- LA5902&UVA1513 树状数组
- Python笔记——windows下cx_Freeze生成Python可执行程序
- 设计模式之中介者模式
- 指针数组 数组指针 指针函数 函数指针的区别
- Hadoop学习笔记(11)-搭建Hive伪分布式及简单操作
- 单例模式与静态变量的区别
- java中的static
- python 面向对象基础
- [Qt起航]第三篇——(二)对话框的设计
- nodejs分析excel文件将结果写入excel文件
- flex布局
- 视频播放控件SurfaceView与VideoView
- JAVA-正则表达式