第五节 hive的安装

来源:互联网 发布:网络推广专员工作内容 编辑:程序博客网 时间:2024/06/06 08:28

1,hive的安装
apache所有项目的历史版本网址:archive.apache.org
(1)hive基于Hadoop,要安装hive先要安装hadoop
(2)安装模式
–嵌入模式
元数据信息被存储在hive自带的derby数据库中
只允许创建一个连接
多用于Demo
–本地模式
元数据信息被存储在mysql数据库中
MySQL数据库与hive运行在同一台物理机上
多用于开发测试
–远程模式
元数据信息被存储在mysql数据库中
MySQL数据库与hive运行在不同的物理机上

2 hive的嵌入式安装
Hive是为了解决hadoop中mapreduce编写困难,提供给熟悉sql的人使用的。只要你对SQL有一定的了解,就能通过Hive写出mapreduce的程序,而不需要去学习hadoop中的api。
在部署前需要确认安装jdk以及Hadoop。
(1),到官网下载hive包,一般命名为hive-x.y.z.tar.gz,然后解压

  //linux解压命令   $ tar -xzvf hive-x.y.z.tar.gz/

(2),设置环境变量 HIVE_HOME = 安装目录:
(3),加入$HIVE_HOME/bin到你的path

$ export PATH=$HIVE_HOME/bin:$PATH

(4),运行下面的命令,新建文件夹作为hive存放数据文件(默认在/user/hive/warehouse)和临时文件(默认在/tmp目录下)的目录

$ $HADOOP_HOME/bin/hadoop fs -mkdir       /tmp$ $HADOOP_HOME/bin/hadoop fs -mkdir       /user/hive/warehouse$ $HADOOP_HOME/bin/hadoop fs -chmod g+w   /tmp$ $HADOOP_HOME/bin/hadoop fs -chmod g+w   /user/hive/warehouse   

如果需要修改目录,需要修改$HIVE_HOME/conf/hive-site.xml中的配置。
(5),初始化元数据数据库,这里以默认的derby数据库作为元数据库

//语法    $HIVE_HOME/bin/schematool -dbType <db type> -initSchema//执行实例$HIVE_HOME/bin/schematool -dbType derby -initSchema

(6),使用hive命令就可以启动hiveshell了,

$HIVE_HOME/bin/hive

注意:hive使用内嵌的模式只能在同一个目录下启动,否则会保错

3,hive的远程安装和本地安装
http://www.cnblogs.com/tq03/p/5107949.html

原创粉丝点击