Spark使用小结:Java版Join操作
来源:互联网 发布:怪物猎人p3软件数据 编辑:程序博客网 时间:2024/05/20 17:06
实现两组数据的Join操作。
第一组:i, i*i
第二组:i, 'a'+i
join之后的结果是:i, i*i, 'a'+i
public class SparkSample { private static final Pattern SPACE = Pattern.compile(" "); public static void main(String args[]) { SparkConf sparkConf = new SparkConf(); sparkConf.setAppName("SparkJavaWordCount"); sparkConf.setMaster("local"); JavaSparkContext context = new JavaSparkContext(sparkConf); List<Integer> data = Arrays.asList(1,2,3,4,5); JavaRDD<Integer> distData= context.parallelize(data); JavaPairRDD<Integer, Integer> firstRDD = distData.mapToPair(new PairFunction<Integer, Integer, Integer>() { @Override public Tuple2<Integer, Integer> call(Integer integer) throws Exception { return new Tuple2(integer, integer*integer); } }); JavaPairRDD<Integer, String> secondRDD = distData.mapToPair(new PairFunction<Integer, Integer, String>() { @Override public Tuple2<Integer, String> call(Integer integer) throws Exception { return new Tuple2(integer, String.valueOf((char)('a' + integer))); }; }); JavaPairRDD<Integer, Tuple2<Integer, String>> joinRDD = firstRDD.join(secondRDD); JavaRDD<String> result = joinRDD.map(new Function<Tuple2<Integer, Tuple2<Integer, String>>, String>() { @Override public String call(Tuple2<Integer, Tuple2<Integer, String>> integerTuple2Tuple2) throws Exception { int key = integerTuple2Tuple2._1(); int value1 = integerTuple2Tuple2._2()._1(); String value2 = integerTuple2Tuple2._2()._2(); return key + " " + value1 + " " + value2; } }); List<String> reslist = result.collect(); for(String str : reslist) { System.out.println(str); } context.stop(); }}
0 0
- Spark使用小结:Java版Join操作
- spark join操作
- Hive join操作小结
- Hive join操作小结
- Hive join操作小结
- Spark使用小结:Java版的GroupByKey示例
- spark join java
- spark java join
- Spark Scala DataFram join 操作
- Spark中常见join操作
- 外链接操作小结 inner join & left join & right join
- 基于spark实现表的join操作
- spark中join和group操作
- Spark RDD转换操作union、join、cogroup
- 使用Java JDK操作ZIP小结
- spark-join
- spark join
- Spark的Dataset操作(五)-多表操作 join
- POJ 3220 Jessica's Reading Problem(Two pointers)
- HDU 4493 Tutor(四舍五入 模拟)
- 安卓探索之旅
- Java 线程池的原理与实现
- android——实现点击两次返回按钮退出程序
- Spark使用小结:Java版Join操作
- 杭电(1009)FatMouse' Trade (贪心)
- 从std::vector中移除指定元素的方法
- Android全局异常捕获
- Java多线程——锁(Synchronized、Lock、ReentrantLock、ReadWriteLock、ReentrantReadWriteLock)
- Java 中的堆内存
- UI控件--SwipeRefreshLayout
- SpringMVC——接收请求参数和页面传参
- Tesseract OCR Tutorial