WordCount过程详解

来源:互联网 发布:程序员薪资 编辑:程序博客网 时间:2024/06/04 18:22

1.HDFS中存储(分布式)数据
helloSpark.txt
2.从HDFS上读取分布式文件并且以数据分片的方式,存在于集群之中
HadoopRDD:
多台机器上
这里写图片描述
这里写图片描述
图转自地址
这里写图片描述
图转自地址

0 0