Hive metastore三种存储方式

来源:互联网 发布:c语言中的&是什么意思 编辑:程序博客网 时间:2024/05/21 17:30

Hive metastore三种存储方式:

转自URL:http://blog.csdn.net/duguduchong/article/details/8856974

http://www.fuzhijie.me/?p=377


一、使用derby数据库存储元数据。

这种方式是最简单的存储方式,只需要在hive-default.xml或hive-site.xml做如下配置便可。

[plain] view plaincopy
  1. <property>  
  2.   <name>javax.jdo.option.ConnectionURL</name>  
  3.   <value>jdbc:derby:;databaseName=metastore_db;create=true</value>  
  4. </property>  
  5.    
  6. <property>  
  7.   <name>javax.jdo.option.ConnectionDriverName</name>  
  8.   <value>org.apache.derby.jdbc.EmbeddedDriver</value>  
  9. </property>  
  10.    
  11. <property>  
  12.   <name>hive.metastore.local</name>  
  13.   <value>true</value>  
  14. </property>  
  15.    
  16. <property>  
  17.   <name>hive.metastore.warehouse.dir</name>  
  18.   <value>/user/hive/warehouse</value>  
  19. </property>  
  20.    
  21. <property>  
  22.   <name>hive.metastore.warehouse.dir</name>  
  23.   <value>/user/hive/warehouse</value>  
  24. </property>  

 

使用derby存储方式时,运行hive会在当前目录生成一个derby文件和一个metastore_db目录。这种存储方式的弊端是在同一个目录下同时只能有一个hive客户端能使用数据库,否则会提示如下错误(这是一个很常见的错误)。

[plain] view plaincopy
  1. hive> show tables;  
  2. FAILED: Error in metadata: javax.jdo.JDOFatalDataStoreException: Failed to start database 'metastore_db', see the next exception for details.  
  3. NestedThrowables:  
  4. java.sql.SQLException: Failed to start database 'metastore_db', see the next exception for details.  
  5. FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask  

二、使用本机mysql服务器存储元数据。这种存储方式需要在本地运行一个mysql服务器,并作如下配置(下面两种使用mysql的方式,需要将mysql的jar包拷贝到$HIVE_HOME/lib目录下)。

[plain] view plaincopy
  1. <property>  
  2.   <name>hive.metastore.warehouse.dir</name>  
  3.   <value>/user/hive_remote/warehouse</value>  
  4. </property>  
  5.    
  6. <property>  
  7.   <name>hive.metastore.local</name>  
  8.   <value>true</value>  
  9. </property>  
  10.    
  11. <property>  
  12.   <name>javax.jdo.option.ConnectionURL</name>  
  13.   <value>jdbc:mysql://localhost/hive_remote?createDatabaseIfNotExist=true</value>  
  14. </property>  
  15.    
  16. <property>  
  17.   <name>javax.jdo.option.ConnectionDriverName</name>  
  18.   <value>com.mysql.jdbc.Driver</value>  
  19. </property>  
  20.    
  21. <property>  
  22.   <name>javax.jdo.option.ConnectionUserName</name>  
  23.   <value>root</value>  
  24. </property>  
  25.    
  26. <property>  
  27.   <name>javax.jdo.option.ConnectionPassword</name>  
  28.   <value>dandan</value>  
  29. </property>  


三、使用远端mysql服务器存储元数据。这种存储方式需要在远端服务器运行一个mysql服务器,并且需要在Hive服务器启动meta服务。

1)Hive服务器端配置如下。

[plain] view plaincopy
  1. <property>  
  2.   <name>hive.metastore.warehouse.dir</name>  
  3.   <value>/user/hive_remote/warehouse</value>  
  4. </property>  
  5.    
  6.   <name>javax.jdo.option.ConnectionURL</name>  
  7.   <value>jdbc:mysql://localhost/hive_remote?createDatabaseIfNotExist=true</value>  
  8. </property>  
  9.    
  10. <property>  
  11.   <name>javax.jdo.option.ConnectionDriverName</name>  
  12.   <value>com.mysql.jdbc.Driver</value>  
  13. </property>  
  14.    
  15. <property>  
  16.   <name>javax.jdo.option.ConnectionUserName</name>  
  17.   <value>root</value>  
  18. </property>  
  19.    
  20. <property>  
  21.   <name>javax.jdo.option.ConnectionPassword</name>  
  22.   <value>dandan</value>  
  23. </property>  


2)Hive客户端配置如下。

[plain] view plaincopy
  1. <property>  
  2.   <name>hive.metastore.warehouse.dir</name>  
  3.   <value>/user/hive_remote/warehouse</value>  
  4. </property>  
  5.    
  6. <property>  
  7.   <name>hive.metastore.local</name>  
  8.   <value>false</value>  
  9. </property>  
  10.    
  11. <property>  
  12.   <name>hive.metastore.uris</name>  
  13.   <value>thrift://localhost:9083</value>  
  14. </property>  



3)服务进程启动如下,默认监听的端口是9083(Hive版本低于0.5的才这样启动)。

[plain] view plaincopy
  1. henshao@henshao-desktop:~/hive-0.3.99.1/conf$ $JAVA_HOME/bin/java  -Xmx1024m -Dlog4j.configuration=file://$HIVE_HOME/conf/hive-log4j.properties -Djava.library.path=$HADOOP_HOME/lib/native/Linux-amd64-64/ -cp $CLASSPATH:$HADOOP_HOME/hadoop-0.19.2-core.jar org.apache.hadoop.hive.metastore.HiveMetaStore  


这里配置classpath太麻烦了,要把hadoop和hive的jar包都加到classpath上,手动加容易导致依赖错误。我写了一个简单的脚本,把$HIVE_HOME/lib下的jar全部连起来,用冒号分隔开。脚本代码如下。

[plain] view plaincopy
  1. #!/bin/bash  
  2.    
  3. CLASSPATH=.  
  4.    
  5. for dir in $*  
  6. do  
  7.     forfile in `ls $dir`  
  8.     do  
  9.         CLASSPATH=$CLASSPATH:$dir/$file  
  10.     done  
  11. done  
  12.    
  13. echo $CLASSPATH  


运行时,只需要输入”./generate_classpath.sh $HIVE_HOME/lib”便可。然后将生成的字符串贴到.bashrc中,赋给CLASSPATH变量。

hive启动时有一个选项”–config”可以指定包含启动客户端用的配置文件的目录,该目录下需要有hive-default.xml或hive-site.xml文件。

[plain] view plaincopy
  1. hive --config conf_dir  


根据我的实践发现,其实第二种方法也可以将Hive的元数据保存到一台远端服务器上,只要配置好javax.jdo.option.ConnectionURL这个连接串就行。


0 0
原创粉丝点击