<spark>flatmap 和 map
来源:互联网 发布:平面设计和淘宝美工 编辑:程序博客网 时间:2024/05/25 12:22
flatmap
import org.apache.spark.SparkConf;import org.apache.spark.api.java.JavaRDD;import org.apache.spark.api.java.JavaSparkContext;import org.apache.spark.api.java.function.FlatMapFunction;import java.util.Arrays;/** * Created by hadoop on 17-2-23. */public class JavaSplit { public static void main(String[] args) throws Exception{ SparkConf conf = new SparkConf().setAppName("Split"); JavaSparkContext sc = new JavaSparkContext(conf); JavaRDD<String> lines = sc.parallelize(Arrays.asList("Hello world","Hello Leo01")); JavaRDD<String> words = lines.flatMap( new FlatMapFunction<String, String>() { @Override public Iterable<String> call(String s) throws Exception { return Arrays.asList(s.split(" ")); } } ); System.out.println(words.collect()); }}
map
import org.apache.spark.SparkConf;import org.apache.spark.api.java.JavaRDD;import org.apache.spark.api.java.JavaSparkContext;import org.apache.spark.api.java.function.Function;import java.util.Arrays;/** * Created by hadoop on 17-2-23. */public class JavaPow { public static void main(String[] args) throws Exception{ SparkConf conf = new SparkConf().setAppName("Pow"); JavaSparkContext sc = new JavaSparkContext(conf); JavaRDD<Integer> rdd = sc.parallelize(Arrays.asList(1,2,3,4,5,6)); JavaRDD<Integer> result = rdd.map(new Function<Integer,Integer>(){ public Integer call(Integer x) { return x*x; } }); //System.out.println(StringUtils.join(result.collect(),",")); System.out.println(result.collect()); }}
flatmap处理过的数据是扁平化的数组,map处理的数据则是根据处理的数据条数来储存
如:{“1 2”,”3 4”} 分别经过flatmap和map处理过后的数据形式是
flatmap:{“1”,”2”,”3”,”4”};
map:{{“1”,”2”},{“3”,”4”}};
0 0
- <spark>flatmap 和 map
- spark中的map和flatMap
- Spark操作-map和flatMap
- Spark之 map和flatMap
- Spark的flatMap和Map的区别
- spark中flatmap和map的区别
- Spark中map和flatmap的区别
- spark RDD的map和flatmap
- spark 中map 和flatmap 的区别
- Spark map flatMap
- spark:map mapPartitions flatmap
- spark:map mapPartitions flatmap
- spark学习-16-Spark的Map()和FlatMap()函数使用
- spark map flatMap flatMapToPair mapPartitions 的区别和用途
- spark map flatMap flatMapToPair mapPartitions 的区别和用途
- spark中map和flatmap之间的区别
- Spark map与flatmap区别
- Spark中map与flatMap
- vuejs2.0实战:仿豆瓣app项目,创建自定义组件tabbar
- ICM Technex 2017 and Codeforces Round #400 (Div. 1 + Div. 2, combined)A+B
- 提取文件夹中所有文件名(Windows)
- mysql实现主从复制
- 简单常用的信号集操作函数
- <spark>flatmap 和 map
- 工厂方法模式
- 二叉树的遍历
- OkHttp文件上传及管理之初步实现
- Java Web 开发,eclipse 和MyEclipse搭建开发环境
- 安卓使用BroadcastReceiver监听接受短信信息
- 转qt 中的timer
- 正则表达式匹配网页的链接
- 开发问题汇总