spark操作hive简单代码
来源:互联网 发布:c 游戏编程 pdf 编辑:程序博客网 时间:2024/05/22 07:55
import org.apache.spark.SparkConfimport org.apache.spark.sql.SparkSession/** * Created by zengxiaosen on 16/9/23. */object hiveoperation { def main(args: Array[String]): Unit = { val sparkConf = new SparkConf().setAppName("hive").setMaster("local") val ss = SparkSession.builder() .enableHiveSupport() .config(sparkConf) .getOrCreate() import ss.implicits._ val date = "2015-08-28" //通常通过参数传过来 /* 在hive表中 desc track_log 出现: id string url string referer string keyword string type string guid string pageid string moduleid string linkid string attachedinfo string sessionid string trackeru string cookie string ordercode string tracktime string enduserid string firstlink string sessionviewno string productid string curmerchantid string provinceid string cityid string ds string hour string #Partition information #col_name data_type comment ds string hour string */ val sqlStr = s""" |insert overwrite into daily_visit partition (date='$date') //日期,通常是通过参数传进来的 |select date,count(distinct guid) uv,sum(pv) pv, |count(case when pv>=2 then sessionid else null end) second_num, |count(sessionid) visits from |(select ds date, sessionid, max(guid) guid, count(url) pv from tracklog and hour='18' |group by ds,sessionid) a |group by date """.stripMargin println("执行中。。。"+sqlStr) //返回dataframe,即dataset val rdd = ss.sql(sqlStr) rdd.rdd.foreach(println) /* 把hive-site.xml放到工程里,执行无法直接连上hive!!! spark通过thrift服务,访问hive元数据库 在pom中加入 <property> <name>hive.metastore.uris</name> <value>thrift://master:9083</value> </property> 在idea上从来没有实现过,所以还是打包去集群去运行把! 原因是idea无法连上thrift://master:9083 */ /* 结果落到hive表 在hive中建表: create table daily_visit( //date string因为是分区表,所以这个日期就不要里 uv bigint, pv bigint, second_num bigint, visits bigint) partitioned by(date string) show tables desc daily_visit */ }}
0 0
- spark操作hive简单代码
- 【spark】spark-hive操作
- Spark DataFrme操作Hive
- Hive编程指南-Spark操作Hive
- spark使用Hive表操作
- Hive的简单操作
- 把Hive操作的spark代码丢到yarn上面运行找不到数据库
- spark简单代码示例
- spark+hcatalog操作hive表及其数据
- Spark SQL1.2与Hive互通操作
- spark-sql操作hive和hdfs
- Spark操作hive遇到的问题
- hive/hbase的简单操作
- hive 的 简单操作语句
- hive 简单操作和错误
- 【HIVE 入门2】简单操作
- hive 简单操作(1)
- spark文件操作简单实例
- 函数的可积性与原函数的存在性辨析
- nginx、php-fpm默认配置与性能–TCP socket还是unix domain socket
- 2017届CVTE面试经验
- graphics.h
- 八数码问题: 八数码的游戏 九宫格里面放入8个数字 启发式搜索(1)
- spark操作hive简单代码
- 递归函数时间复杂度分析
- 数据结构——Josephus问题顺序表实现
- leetCode练习(36)
- python合并同类型excel表格
- MySql的安装
- Android 硬件加速
- reference other engineer's code to explain wheather linux terminal can display matplotlib' figure
- LVS之——Lvs Net网络拓扑实现负载均衡