程序博客网 > 先学编程还是数据库

spark伪分布式安装与测试

来源：互联网发布：先学编程还是数据库编辑：程序博客网时间：2024/06/01 23:12

1、下载scala2.11.5版本，下载地址为：http://www.scala-lang.org/download/2.11.5.html

2、安装和配置scala：

第一步：上传scala安装包并解压

第二步配置SCALA_HOME环境变量到bash_profile

第三步 source 使配置环境变量生效：

第四步验证scala：

3、下载spark 1.2.0，具体下载地址：http://spark.apache.org/downloads.html

4、安装和配置spark：

第一步解压spark：

第二步配置SPARK_HOME环境变量：

第三步使用source生效：

进入spark的conf目录：

第四步修改slaves文件，首先打开该文件：

slaves修改后：

第五步配置spark-env.sh

首先把spark-env.sh.template拷贝到spark-env.sh：

然后打开“spark-env.sh”文件：

spark-env.sh文件修改后：

5、启动spark伪分布式帮查看信息：

第一步先保证hadoop集群或者伪分布式启动成功，使用jps看下进程信息：

如果没有启动，进入hadoop的sbin目录执行 ./start-all.sh

第二步启动spark：

进入spark的sbin目录下执行“start-all.sh”：

此刻我们看到有新进程“Master” 和"Worker"

我们访问“http://master:8080/”，进如spark的web控制台页面：

从页面上可以看到一个Worker节点的信息。

我们进入spark的bin目录，使用“spark-shell”控制台：

通过访问"http://master:4040"，进入spark-shell web控制台页面：

6、测试spark伪分布式：

我们使用之前上传到hdfs中的/data/test/README.txt文件进行mapreduce

取得hdfs文件：

对读取的文件进行一下操作：

使用collect命令提交并执行job：

readmeFile.collect

查看spark-shell web控制台：

states：

端口整理：

master端口是7077

master webui是8080

spark shell webui端口是4040

0 0

先学编程还是数据库

先学编程还是数据库

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子超级海岛牧场海岛奇兵无限钻石攻略超级海岛大亨海岛奇兵破解版下载海岛奇兵360版异界之海岛大领主悠闲海岛生活异界海岛领主海岛奇兵45级战争工厂怎么打明日之后海岛特殊宝箱世界海岛旅游排名海岛旅游胜地中国海岛游推荐海岛旅游排名国内海岛旅游排名东南亚海岛游推荐海岛超纤皮革海岛游必备物品清单海岛旅游报价海岛奇兵账号怎么找回海岛奇兵内购破解版海岛奇兵神像属性海岛旅游哪里好玩海岛奇兵破解版无限钻海岛奇兵10本防御阵型世界海岛排名经济实惠的海岛游海岛奇兵升级数据大全海岛奇兵礼包领取海岛奇兵升级数据海岛奇兵电脑版海岛奇兵雕像属性怎么下载海岛奇兵破解版海岛奇兵怎么改名字海岛奇兵阵型全球海岛旅游排名海岛奇兵水晶属性海岛奇兵内购破解版下载海岛奇兵雕像海岛农场主txt下载亚洲海岛旅游