spark读取hive表数据实操
来源:互联网 发布:计算器编程代码 编辑:程序博客网 时间:2024/06/05 11:38
环境:spark1.6 hive1.2.1 hadoop2.6.4
1.添加一下依赖包
spark-hive_2.10的添加为了能创建hivecontext对象
<dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-hive_2.10</artifactId> <version>1.6.1</version> </dependency>
mysql驱动链接元数据
<dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-java</artifactId> <version>5.1.38</version> <scope>compile</scope> </dependency>
2.添加hive-site.xml文件内容如下
其中mysql中hive库是hive的元数据库
<?xml version="1.0" encoding="UTF-8"?><!--Autogenerated by Cloudera Manager--><configuration> <property> <name>javax.jdo.option.ConnectionURL</name> <value>jdbc:mysql://master:3306/hive?createDatabaseIfNotExist=true</value> </property> <property> <name>javax.jdo.option.ConnectionDriverName</name> <value>com.mysql.jdbc.Driver</value> </property> <property> <name>javax.jdo.option.ConnectionUserName</name> <value>hive</value> </property> <property> <name>javax.jdo.option.ConnectionPassword</name> <value>hive</value> </property></configuration>
3.开始读取hive表的数据了,代码如下
object App { def main(args: Array[String]): Unit = { val conf = new SparkConf().setAppName("test").setMaster("local[2]") val sc = new SparkContext(conf) val sqlContext = new HiveContext(sc) sqlContext.table("test.person") // 库名.表名 的格式 .registerTempTable("person") // 注册成临时表 sqlContext.sql( """ | select * | from person | limit 10 """.stripMargin).show() sc.stop() }}
阅读全文
0 0
- spark读取hive表数据实操
- 第6天-sql简单数据实操
- MySQL数据库(五)_VS中实现插入MySQL数据实操
- spark-sql读取hive
- spark 读取hive parquet
- spark-sql读取hive挂载alluxio
- 基于Spark的公安大数据实时运维技术实践
- 基于Spark的公安大数据实时运维技术实践
- spark使用Hive表操作
- Spark SQL来读取现有Hive中的数据
- Spark SQL读取hive数据时报找不到mysql驱动
- spark 批量读取HDFS(hive分区)parquet文件
- Spark-Hive
- Spark Hive
- 【spark】spark-hive操作
- Spark SQL读取Hive数据配置及使用Thrift JDBC/ODBC Server访问Spark SQL
- spark+hcatalog操作hive表及其数据
- spark<Dataframe 直接写入hive表>
- 如何解决warning: no newline at end of file?
- 一个很有意思的平均值实验
- iOS开发经验总结(一)
- mybatis <where> <set>标签的作用
- 问题解决java.lang.IllegalStateException: Circular dependencies cannot exist in RelativeLayout
- spark读取hive表数据实操
- SSM框架Spring+SpringMVC+MyBatis——详细整合教程
- 《机器学习实战》学习笔记之第五章—— Logistic回归
- SSM 框架的批量删除
- 编译内核 报错 -mlittle-endian
- html屏蔽右键、禁止复制
- Android自定义View之自定义评价打分控件RatingBar实现自定义星星大小和间距
- 使用python读取mysql数据库并进行数据的操作
- adb操作命令