hive介绍与安装

来源:互联网 发布:域名注册网站哪个好 编辑:程序博客网 时间:2024/05/20 01:45

hive:数据仓库
hive:解释器,编译器,优化器
hive运行时,元数据存储在关系型数据库里。默认的是自带的derby数据库,不建议使用。
起源于FaceBook,Hive在Hadoop中扮演数据仓库的角色。建立在Hadoop集群的最顶层,对存储在Hadoop群上的数据提供类SQL的接口进行操作。你可以用 HiveQL进行select,join,等等操作。
如果你有数据仓库的需求并且你擅长写SQL并且不想写MapReduce jobs就可以用Hive代替

配置使用mysql存储元数据方法:
1.上传mysql-connector-java-5.1.9.jar至hive/lib目录下
2.如果是远程登录mysql,参考博文:设置客户端登陆阿里云主机上的mysql
grant all on . to root@’%’ identified by ‘123456’
3.vi hive-site.xml

<property>  <name>javax.jdo.option.ConnectionURL</name>  <value>jdbc:mysql://ubuntu/hive</value>  <description>JDBC connect string for a JDBC metastore</description></property><property>  <name>javax.jdo.option.ConnectionDriverName</name>  <value>com.mysql.jdbc.Driver</value>  <description>Driver class name for a JDBC metastore</description></property><property>  <name>javax.jdo.option.ConnectionUserName</name>  <value>mine</value>  <description>username to use against metastore database</description></property><property>  <name>javax.jdo.option.ConnectionPassword</name>  <value>mine</value>  <description>password to use against metastore database</description></property>

linux系统CLI命令:
hive -e ‘select a.col from tab1 a’
hive -S -e ‘select a.col from tab1 a’>a.txt
hive -f /home/my/hive-script.sql

解压hive tar.gz
进入conf文件夹
cp hive-default.xml.template hive-site.xml
然后进入bin
./hive启动即可,启动hive前先启动hadoop,zookeeper
hive0.13.0支持hadoop1.x和hadoop2.x

0 0
原创粉丝点击