windows下安装spark环境

来源:互联网 发布:swift model数组 编辑:程序博客网 时间:2024/06/05 01:58

本机安装JDK1.8.0,spark2.0.1,scala2.12.1

安装JDK

安装scala

见上篇
注意:Spark的各个版本需要跟相应的Scala版本对应.

安装Spark

http://spark.apache.org/downloads.html

  • 选择对应Hadoop版本的Spark,选择编译好的Pre-built版本,下载完成后将文件进行解压即可。在Spark的文件目录路径名中,不要出现空格。
  • 将Spark的bin目录添加到系统变量PATH中。
  • cmd命令行中,直接执行spark-shell命令,即可开启Spark的交互式命令行模式。

这里写图片描述

运行spark-shell 显示scala版本为2.11.8,spark可能自带了scala,或许可以不单独安装scala,未测试。

附:
wordCount

scala> var lines=sc.textFile("C:/Users/Administrator/Desktop/1.txt")scala> lines.flatMap(line=>line.split(" ")).map(word=>(word,1)).reduceByKey((a,b)=>a+b).foreach(println)
0 0