大数据IMF传奇行动绝密课程第55课:60分钟从零起步驾驭Hive实战
来源:互联网 发布:qq旋风 for mac 官方 编辑:程序博客网 时间:2024/04/30 20:30
60分钟从零起步驾驭Hive实战
1、Hive本质解析
2、Hive安装实战
3、使用Hive操作搜索引擎数据实战
一、Hive的本质是什么?
1、Hive是分布式数据仓库,同时又是查询引擎,所以SparkSQL取代的只是Hive查询引擎,在企业实际生产环境下Hive+Spark SQL是目前最为经典的数据分析组合;
2、Hive本身就是一个简单单机版本的软件,主要负责:
a)把HQL翻译成Mapper(s)-Reducer-Mapper(s)的代码;并且可能产生很多MapReduce的Job;
b)把生成的MapReduce代码及相关资源打包成为Jar并发布到Hadoop集群中且进行运行(这一切都是自动的)。
二、Hive安装和配置实战
1、我们使用的是Hive1.2.1版本
2、安装:
a)配置./.bashrc
export HIVE_HOME=
export HIVE_CONF_DIR=
PATH追加${HIVE_HOME}/bin
b)配置conf/hive-env.sh
export HADOOP_HOME HIVE_HOME HIVE_CONF_DIR
c)hive-default.xml.template 变成hive-site.xml
Hive默认情况下存放元数据的是Derby,遗憾的是Derby是单用户的,所以在生产环境下一般会采用支持多用户的数据库来进行Meta Store,且进行Master-Slaves主从读写分离和备份;我们最常使用MySQL。
hive.metastore.sarehouse.dir
默认/user/hive/warehouse(HDFS)L的安装和配置
4、Hive的表有两种基本类型:一种内部表(这种表数据属于Hive本身,言外之意是如果原来的数据在HDFS的其它地方,此时数据会通过HDFS移动到Hive数据仓库所在的目录,如果删除Hive中的该表的话,数据和元素据均会被删除),另外一种是外部表(这种表数据不属于Hive数据仓库,元数据中会表达具体数据在哪里,使用的时候和内部表的使用是一样的,只是如果通过Hive去删除的话,此时删除的只是元数据,并没有删除数据本身)。
三、使用Hive分析搜索数据
- 大数据IMF传奇行动绝密课程第55课:60分钟从零起步驾驭Hive实战
- 大数据IMF传奇行动绝密课程第69课:Spark SQL通过Hive数据源实战
- 大数据IMF传奇行动绝密课程第57课:Spark SQL on Hive配置及实战
- 大数据IMF传奇行动绝密课程第74课:Hive on Spark大揭秘
- 大数据IMF传奇行动绝密课程第67课:spark SQL案例综合实战
- 大数据IMF传奇行动绝密课程第73课:Spark SQL Thrift Server实战
- 大数据IMF传奇行动绝密课程第21课:从Spark架构中透视Job
- 大数据IMF传奇行动绝密课程第21课:从Spark架构中透视Job
- 大数据IMF传奇行动绝密课程第16课:RDD实战(RDD基本操作实战及Transformation流程图)
- 大数据IMF传奇行动绝密课程第61课:Spark SQL数据加载和保存内幕深度解密实战
- 第55课:60分钟内从零起步驾驭Hive实战学习笔记
- 大数据IMF传奇行动绝密课程第88课:SparkStreaming从Flume Poll数据案例实战和内幕源码解密
- 大数据IMF传奇行动绝密课程第58课:使用Java和Scala在IDE中开发DataFrame实战
- 大数据IMF传奇行动绝密课程第70课:Spark SQL内置函数解密与实战
- 大数据IMF传奇行动绝密课程第71课:Spark SQL窗口函数解密与实战
- 大数据IMF传奇行动绝密课程第72课:Spark SQL UDF和UDAF解密与实战
- 大数据IMF传奇行动绝密课程第75-79课:Spark SQL基于网站Log的综合案例实战
- 大数据IMF传奇行动绝密课程第80课:Spark SQL网站搜索综合案例实战
- 1059. Prime Factors (25)
- Java数组运算
- Android简易实战教程--第二十七话《自定义View入门案例之开关按钮详细分析》
- Java Socket和ServerSocket
- JAVA语法基础Demo练习
- 大数据IMF传奇行动绝密课程第55课:60分钟从零起步驾驭Hive实战
- 微信公众平台--接收普通消息与事件
- 学习ucos ii 的一点一滴----ucos ii中的的任务(一)
- 加载场景,背景,按钮,音乐,切换场景,初始plist
- VS2010尝试运行项目时出错,无法启动程序
- C++
- Android 使用CoordinatorLayout实现滚动标题栏效果
- linux下编译安装
- 51条难婚定律到底有多难?