Spark Scala 范例
来源:互联网 发布:全国城市mysql数据库 编辑:程序博客网 时间:2024/05/17 06:33
1.处理HDFS日志文件中错误日志
val lines = sc.textFile("hdfs://...") //lines is a org.apache.spark.rdd.MappedRDDval errors = lines.filter(_.startsWith("ERROR")) //errors is a org.apache.spark.rdd.FilterRDDerrors.cache() //persist到内存中errors.count() //触发action,计算errors有多少个,即ERROR的多少行errors.filter(_.contains("MySQL")).count()errors.filter(_.contains("HDFS")).map(_.split('\t')(3)).collect()
2. SQL RDDRelation
package org.apache.spark.examples.sqlimport org.apache.spark.{SparkConf,SparkContext}import org.apache.spark.sql.SQLContextimport org.apache.spark.sql.functions._case class Record(key:Int, value:String)object RDDRelation{ def main(args: Array[String]){ val sparkConf = new SparkConf().setAppName("RDDRelation") val sc = new SparkContext(sparkConf) val sqlContext = new SQLContext(sc)import sqlContext.implicits._val df = sc.parallelize(1 to 100).map(i => Record(i, s"val_$i"))).toDF()df.register }}
0 0
- Spark Scala 范例
- spark,scala
- spark sql基础使用范例
- scala 开发spark程序
- scala for spark
- scala spark开发模式
- spark scala wordcout
- Scala and Spark Begin
- Spark+Scala课程包
- 初学spark--scala--45
- Spark与Scala学习
- 实战Scala & Spark (1)
- 实战Scala & Spark (2)
- 实战Scala & Spark (3)
- Scala && Spark 安装
- Scala Spark 求众数
- spark&scala集合
- spark scala基础知识汇总
- 移动应用效率对比
- iOS 7: 使用Base64编解码NSData和NSString对象
- 光标 与 输入法 之 android:imeOptions属性
- Oracle环境变量NLS_LANG
- Objective-C NSArray & NSMutableArray
- Spark Scala 范例
- C语言 基础知识与要点-数据类型与运算符
- ubuntu防火墙
- Java编译器的流程图
- [maven学习笔记]第一节,认识maven,搭建maven开发环境,写第一个HelloWorld
- 使用ajaxfileupload.js异步上传文件到服务器
- 无题
- PAT Basic 1004
- 在laravel框架中使用mongodb数据库