spark 读取avro文件
来源:互联网 发布:js 严格模式 编辑:程序博客网 时间:2024/06/05 23:48
1.引入依赖
<dependency> <groupId>com.databricks</groupId> <artifactId>spark-avro_2.10</artifactId> <version>2.0.1</version></dependency>
2.当读取的avro文件
SparkConf conf = new SparkConf();conf.setAppName("SparkReadAvroTest");JavaSparkContext sc = new JavaSparkContext(conf);SQLContext sqlCon = new SQLContext(sc);sqlCon.sparkContext().hadoopConfiguration().set("avro.mapred.ignore.inputs.without.extension", "false");#不是以.avro后缀名结尾时要注意配置DataFrame df = sqlCon.read().format("com.databricks.spark.avro").load("hdfs://avro/test")
3.注意spark的hivecontext不能读取hive中avro格式存储数据的表。
0 0
- spark 读取avro文件
- Spark-Avro学习1之使用SparkSQL读取AVRO文件
- Spark-Avro学习2之使用byDatabricksSparkAvroL读取AVRO文件
- spark使用scala读取Avro数据
- Spark-Avro学习3之使用AvroCompression存储AVRO文件
- Spark-Avro学习4之使用AvroWritePartitioned存储AVRO文件时进行划分
- Spark-Avro学习5之使用AvroReadSpecifyName存储AVRO文件时指定name和namespace
- Spark 读取HDFS文件
- Spark读取文件
- Spark读取HDFS文件
- spark读取csv文件
- spark 读取CSV文件
- Spark 读取多个小文件
- spark读取json,parquet文件
- AVRO文件结构分析
- avro 文件的使用
- spark读取gz文件与parquet文件
- spark streaming+flume avro实时计算
- cTorrent-linux命令行BT下载工具 cTorrent下载
- SSM+Shiro系统登录验证码的实现
- Shiro笔记(一)----Shiro安全框架简介
- org.apache.http.conn.ClientConnectionManager
- 21步助你成为成功优秀的Web开发者
- spark 读取avro文件
- lambda表达式代替匿名内部类
- LCD的时钟显示
- 基于机器学习技术实现一个医学辅助诊断的专家系统原型
- 题目1486:False coin
- 15.4 处理方法的数据绑定
- leetcode -- 53. Maximum Subarray
- springmvct原理
- bootstrap框架中的data-[ ]自定义属性理解