spark伪分布式安装与测试
来源:互联网 发布:先学编程还是数据库 编辑:程序博客网 时间:2024/06/01 23:12
1、下载scala2.11.5版本,下载地址为:http://www.scala-lang.org/download/2.11.5.html
2、安装和配置scala:
第一步:上传scala安装包 并解压
第二步 配置SCALA_HOME环境变量到bash_profile
第三步 source 使配置环境变量生效:
第四步 验证scala:
3、下载spark 1.2.0,具体下载地址:http://spark.apache.org/downloads.html
4、安装和配置spark:
第一步 解压spark:
第二步 配置SPARK_HOME环境变量:
第三步 使用source生效:
进入spark的conf目录:
第四步 修改slaves文件,首先打开该文件:
slaves修改后:
第五步 配置spark-env.sh
首先把spark-env.sh.template拷贝到spark-env.sh:
然后 打开“spark-env.sh”文件:
spark-env.sh文件修改后:
5、启动spark伪分布式帮查看信息:
第一步 先保证hadoop集群或者伪分布式启动成功,使用jps看下进程信息:
如果没有启动,进入hadoop的sbin目录执行 ./start-all.sh
第二步 启动spark:
进入spark的sbin目录下执行“start-all.sh”:
此刻 我们看到有新进程“Master” 和"Worker"
我们访问“http://master:8080/”,进如spark的web控制台页面:
从页面上可以看到一个Worker节点的信息。
我们进入spark的bin目录,使用“spark-shell”控制台:
通过访问"http://master:4040",进入spark-shell web控制台页面:
6、测试spark伪分布式:
我们使用之前上传到hdfs中的/data/test/README.txt文件进行mapreduce
取得hdfs文件:
对读取的文件进行一下操作:
使用collect命令提交并执行job:
readmeFile.collect
查看spark-shell web控制台:
states:
端口整理:
master端口是7077
master webui是8080
spark shell webui端口是4040
- spark伪分布式安装与测试
- 安装spark伪分布式
- spark伪分布式安装
- Spark 伪分布式安装教程
- Hadoop伪分布式安装Spark
- Spark 伪分布式 & 全分布式 安装指南
- Tachyon 0.7.1伪分布式集群安装与测试
- Spark 集群搭建从零开始之2 Spark单机伪分布式安装与配置
- Spark伪分布式安装(不依赖hadoop)
- hadoop2.2.0上spark伪分布式安装
- Spark伪分布式环境下安装指南
- Ubuntu14.04,Spark,伪分布式安装
- Spark伪分布式安装(一)
- centos6.4+hadoop2.2.0 spark伪伪分布式安装
- Spark 伪分布式 & 全分布式 安装指南
- spark-1.6.1 伪分布式 & 全分布式安装
- Hadoop伪分布式与分布式安装
- hadoop2伪分布式的安装及测试
- CDateTimeUI 的bug
- Java 代理使用及代理原理
- 简约之美Jodd-http--应用一箩筐
- Oracle 数据库共享内存分配不足
- mac jade 安装
- spark伪分布式安装与测试
- WPF
- nexus搭建和手动更新索引心得
- 我的博客即将入驻“云栖社区”,诚邀技术同仁一同入驻。
- 动手写一个Python Web 框架学习笔记 - 搭建开发环境 (1)
- Maven 系列 五 :使用Nexus搭建Maven私服
- input输入框的js改变事件
- apache common book 笔记
- C++ 学习二