parquet压缩格式参数设置以及简单操作
来源:互联网 发布:网络视讯赌博真假 编辑:程序博客网 时间:2024/05/21 09:18
Parquet 文件会在 gzip 中自动压缩,因为 Spark 变量 spark.sql.parquet.compression.codec 已在默认情况下设置为 gzip。您还可以将压缩编解码器设置为 uncompressed、snappy 或 lzo
object Save2Parquet { def main(args: Array[String]): Unit = { val conf = new SparkConf().setAppName("Save2Parquet").setMaster("local[2]")// conf.set("spark.sql.parquet.compression.codec","uncompressed") val sc = new SparkContext(conf) val sqlContext = new SQLContext(sc)// val DF = sqlContext.read.json("F:/03.hadoop/data/spark/sql/sqldf.json")// DF.repartition(1)// DF.write.parquet("F:/03.hadoop/data/a") val DF = sqlContext.read.parquet("F:/03.hadoop/data/a/part-r-00000-7cb2b83b-9237-4e11-86a7-663eafa71fc7.gz.parquet") DF.show() sc.stop() }}
阅读全文
0 0
- parquet压缩格式参数设置以及简单操作
- Parquet数据存储格式
- spark操作parquet文件
- orc格式和parquet格式对比
- latex格式设置问题以及压缩…
- 压缩格式 以及 对应解压代码 总结
- MediaCoder压缩参数设置
- tomcat GZIP 压缩参数设置
- hive parquet table 配置使用压缩
- Parquet
- Parquet
- Parquet
- 深入分析Parquet列式存储格式
- 深入分析Parquet列式存储格式
- 深入分析Parquet列式存储格式
- 深入分析Parquet列式存储格式
- 新一代列式存储格式Parquet
- 深入分析Parquet列式存储格式
- webpack-dev-server 支持 react-router BrowserHistory
- 计算机网络 | 基本概念
- ASP.Net 的按钮事件中显示ASPxPopupControl,控件显示不出来
- FFmpeg 学习之 centos 下编译配置
- spring boot(10)-tomcat jdbc连接池
- parquet压缩格式参数设置以及简单操作
- 1.编译openjdk1.8源码
- Android夜间模式的切换
- 线程池的理解及使用
- redis入门——散列类型(hash)
- spring boot(11)-druid监控
- WifiMonotor.java
- centos 找回密码
- 关于本博客