Spark学习三:Spark Schedule以及idea的安装和导入源码

来源:互联网 发布:陈田村拆车件淘宝店 编辑:程序博客网 时间:2024/04/30 15:17

Spark学习三:Spark Schedule以及idea的安装和导入源码

标签(空格分隔): Spark


  • Spark学习三Spark Schedule以及idea的安装和导入源码
    • 一RDD操作过程中的数据位置
    • 二Spark Schedule
    • 三Idea导入spark源码

一,RDD操作过程中的数据位置

[hadoop001@xingyunfei001 spark-1.3.0-bin-2.5.0]$ bin/spark-shell --master local[2]

val rdd = sc.textFile(“xx”, 2)
rdd.flatMap(.split(“\t”)).map((, 1)).reduceByKey((_ + _)).saveAsTextFile

Stage-01
part-01 -> Task-01 : rdd.flatMap(.split(“\t”)).map((, 1)).reduce
part-02 -> Task-02 :rdd.flatMap(.split(“\t”)).map((, 1)).reduce
Stage-02
part-01 -> Task-01 :ByKey((_ + _)).saveAsTextFile
part-02 -> Task-02 :ByKey((_ + _)).saveAsTextFile

rdd.cache

001.jpg-28kB

二,Spark Schedule

001.PNG-319.6kB

002.PNG-278.6kB

003.PNG-171kB

三,Idea导入spark源码

1,bin/idea.sh打开idea(进入时进度条点击取消)

2,集成maven

001.PNG-69.5kB

3,导入源代码
002.PNG-58kB

003.PNG-48.4kB

004.PNG-28.3kB

005.PNG-48.1kB

006.PNG-41.6kB

007.PNG-29.4kB

008.PNG-32.7kB

0 0
原创粉丝点击