hive零散

来源:互联网 发布:淘宝交保证金怎么交30 编辑:程序博客网 时间:2024/05/22 03:10

cloudera自带的spark可用后,安装hive尝试跑shark。

hive是将SQL转换成MR作业运行的工具。

hive的三种模式:

  • 内嵌模式:将元数据保存在本地内嵌的Derby数据库中,这得使用Hive最简单的方式,不过使用内嵌模式的话,缺点也比较明显,因为一个内嵌的Derby数据库每次只能访问一个数据文件,这也就意味着不支持多会话连接。这种情况应对本地测试可能都有所不足,仅供初学者熟悉应用Hive;

       

  • 本地模式:这种模式是将元数据库保存在本地的独立数据库中(比如说MySQL),这样就能够支持多会话多用户连接。

       

  • 远程模式:如果我们的Hive客户端比较多,在每个客户端都安装MySQL服务还是会造成一定的冗余浪费,这种情况下,就可以更进一步,将MySQL也独立出来,将元数据保存在远端独立的MySQL服务中。

     

  • 0 0
    原创粉丝点击