spark本地模式
来源:互联网 发布:java程序员面试一年 编辑:程序博客网 时间:2024/06/04 18:58
spark-shell
还可带参数,设置开启几个线程
spark-shell --master local[3]
设置开启3个线程去跑任务
spark调度
repartition(1)设置reduce的个数,这里设置为1
spark读取hdfs上的文件:wuke01为namenode所在机器名。
sc.textFile("hdfs://wuke01:9000/input/wuke.txt").flatMap(_.split(",")).map((_,1)).collect
var rdd1=sc.parallelize(Array(("one",1),("two",2),("three",3),("four",4)))
var rdd2=sc.parallelize(Array(("five",5),("six",6)))
(rdd1 union rdd2).repartition(1).saveAsTextFile("hdfs://wuke01:9000/tmp")
创建RDD
https://www.iteblog.com/archives/1512
RDD血统
.cache虚拟化 (针对宽依赖的处理)
提交任务
用maven将项目打包成jar包后,拷贝到服务器上,用spark-submit提交任务spark-submit --class main函数所在的类全路径名 jar包所在位置 后面就是输入的参数(比如输入路径 输出路径)
spark-submit --class com.xxx.mainClass xxx.jar hdfs://xxx/input/word.txt hdfs://xxx/output
- spark本地模式
- Spark 本地模式
- spark设置本地运行模式
- Spark本地模式与Spark Standalone伪分布模式
- Spark 本地模式运行 磁盘空间不足
- spark本地模式和Standalone配置
- spark eclipse开发调试 本地单机模式
- Spark实战:单节点本地模式搭建Spark运行环境
- spark 最新版1.0本地模式安装_spark入门学习一
- spark 最新版1.0本地模式安装_spark入门学习一
- 本地模式使用JAVA SACLA 开发 Spark SQL DataFrame
- 0048 linux(ubuntu)中Spark的本地模式安装
- spark 本地调试运行WordCount(java版local模式)
- Spark实战01:单节点本地模式搭建Spark运行环境
- Spark实战1:单节点本地模式搭建Spark运行环境
- idea本地调试spark
- Spark数据本地性
- Spark数据本地性
- 希尔排序
- warriorjs
- 浏览器打不开问题
- 【OpenCV入门教程之十五】水漫金山:OpenCV漫水填充算法(Floodfill)
- 将文件以流的方式存到数据库某个字段中,并且可以从数据库字段中取出来
- spark本地模式
- 《浪潮之巅》第二章 蓝色巨人 IBM公司
- 解决IIS对COM组件的访问异常
- UVA 10585 - Center of Symmetry
- java 5新特性--静态导入
- 产品为何总是做不好 (四): 只願意很聰明的去做 ⋯ 亮點實踐
- 反射遍历解决方案中所有窗体
- 新博客搭建完成啦
- Getting Started with Redux: An Intro