spark(7)-spark RDD的创建(course15)
来源:互联网 发布:linux一键搭建squid 编辑:程序博客网 时间:2024/05/16 06:03
1. RDD的创建
1.1 RDD创建方式
RDD的3种基本的创建方式
- 使用程序中的集合创建RDD;
- 使用本地文件系统创建RDD;
- 使用HDS创建RDD
其他:
- 基于DB创建RDD
- 基于NoSQL,例如HBase
- 基于S3创建RDD
- 基于数据流创建RDD
不同方式的意义
- 通过集合创建RDD的实际意义:测试
- 使用本地文件系统创建RDD的作用:测试大量数据文件
- 使用HDFS创建RDD:生产环境最常用的RDD创建方式
下面以代码演示通过集合创建RDD:
package cn.whbing.spark.SparkApps.cores;import java.util.ArrayList;import org.apache.spark.SparkConf;import org.apache.spark.api.java.JavaRDD;import org.apache.spark.api.java.JavaSparkContext;import org.apache.spark.api.java.function.Function2;public class RDDBasedOnCollection { public static void main(String[] args) { SparkConf conf = new SparkConf(); conf.setAppName("RDD based on javaCollection").setMaster("local"); JavaSparkContext sc = new JavaSparkContext(conf); ArrayList<Integer> list = new ArrayList<Integer>(); for(int i=0;i<100;i++){ list.add(i+1); } JavaRDD<Integer> rdd = sc.parallelize(list); Integer sum = rdd.reduce(new Function2<Integer, Integer, Integer>() { @Override public Integer call(Integer v1, Integer v2) throws Exception { return v1+v2; } }); System.out.println(sum); }}
本地直接运行即可打印结果: 17/12/08 12:07:26 INFO DAGScheduler: Job 0 finished: reduce at RDDBasedOnCollection.java:26, took 3.750192 s
5050
17/12/08 12:07:26 INFO SparkContext: Invoking stop() from shutdown hook
阅读全文
0 0
- spark(7)-spark RDD的创建(course15)
- Spark RDD 的创建 & Accumulators
- spark源码阅读笔记RDD(七) RDD的创建、读取和保存
- [1.2]Spark core编程(一)之RDD总论与创建RDD的三种方式
- Spark创建RDD
- Spark RDD创建操作
- Spark RDD 创建
- spark创建RDD方式
- spark(RDD之间的基本转换)
- Spark的RDD详解(源码)
- spark源码阅读笔记RDD(一)RDD的基本概念
- spark(6)-spark RDD(course14)
- spark中创建RDD的方式
- Spark学习笔记 --- RDD的创建
- spark之RDD(四)
- Spark RDD编程(二)
- Spark RDD 练习题(python)
- Spark Learning(RDD介绍)
- (一)java的介绍和基本常识
- 第十四周 项目一 验证算法 2.直接插入排序
- bzoj 2750: [HAOI2012]Road 最短路+dp
- TreeSet以及存储自定义类重写compareTo()
- 第十五周作业:Java多线程
- spark(7)-spark RDD的创建(course15)
- 四种嵌入式操作系统安全启动分析(unix、linux、qnx、vxworks)
- Vue.js 2.0和Cordova开发webApp环境搭建
- new与delete的重载
- 看图秒懂 | 昨天才发布的容器新项目Kata到底能干啥?
- 关于Linux内核引入的accept_local参数的一个问题
- 【SSH问题】open /home/oracle/.ssh/id_rsa failed: Permission denied.
- react踩坑之路由
- Kubernetes峰会首日直击 | 软件基础设施支撑云原生应用