(6)Spark 2.0.0 伪分布安装
来源:互联网 发布:php测试链接ftp服务器 编辑:程序博客网 时间:2024/06/06 02:48
- 引言
- Hadoop伪分布安装
- Scala安装
- Spark伪分布安装
1.引言
Spark
是专为大规模数据处理而设计的快速通用的计算引擎。Spark
拥有MapReduce
所具有的优点;但不同于MapReduce
的是——中间输出结果可以保存在内存中,从而不再需要读写HDFS
,因此Spark
能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce
的算法。
在本篇博客中主要介绍一下Spark的伪分布安装,博主的环境为:
- 操作系统为:
Centos6.7
JDK
的版本为:1.7
JDK
的安装目录为:/usr/local/jdk
Hadoop
的版本为:2.6.1
Hadoop
的安装目录为:/usr/local/hadoop
scala
的安装版本为2.11.8
scala
的安装目录为/usr/local/scala
spark
的安装版本为2.0.0
spark
的安装目录为/usr/local/spark
2 .Hadoop
伪分布安装
因为Spark
可以使用Yarn
平台调度资源(也可以不使用Yarn
平台,因为个人比较喜欢,所以首先安装了Hadoop
的伪分布),Hadoop
伪分布安装的链接地址为:Hadoop 2.6.1伪分布搭建
如果不安装Yarn
平台,请首先配置SSH
免密码登陆,SSH
免密码登陆请参考地址:SSH免密码登陆
3 .Scala
安装
- 首先将scala解压,并改名
//将scala解压到/usr/local目录下tar -zxvf scala-2.11.8.tgz -C /usr/local///进入到/usr/local目录cd /usr/local//修改scala目录名称mv scala-2.11.8 scala
- 修改环境变量
//修改profile文件vim /etc/profile//修改的环境变量内容export SCALA_HOME=/usr/local/scalaexport PATH=$SCALA_HOME/bin:$PATH//重新加载环境变量文件source /etc/profile
- 验证
scala
是否安装成功
//命令验证scala是否成功安装scala -version
4. Spark
伪分布安装
- 将
Spark
解压,并改名
//将spark解压到/usr/local目录下tar -zxvf spark-2.0.0-bin-hadoop2.6.tgz -C /usr/local///进入到/usr/local目录cd /usr/local//修改spark目录名称mv spark-2.0.0-bin-hadoop2.6 spark
- 修改
spark
的配置文件:conf/spark-env.sh
//将配置模板文件,修改为配置文件cp spark-env.sh.template spark-env.sh//修改配置文件的内容如下所示:export JAVA_HOME=/usr/local/jdkexport SCALA_HOME=/usr/local/scalaexport SPARK_WORKER_MEMORY=1Gexport HADOOP_HOME=/usr/local/hadoopexport HADOOP_CONF_DIR=/usr/local/hadoop/etc/hadoopexport SPARK_MASTER_IP=localhost
- 验证spark是否安装成功
//启动spark(sbin目录下面)./start-all.sh//使用jps查看进程,出现Master和Worker进程即启动成功jps
Web
浏览器验证Spark
安装成功(http://localhost:8080)
//启动spark(sbin目录下面)./start-all.sh//当启动spark之后,浏览器输入http://localhost:8080,如果出现下图即启动成功
阅读全文
1 0
- (6)Spark 2.0.0 伪分布安装
- Spark 伪分布安装
- SPARK伪分布安装
- Spark伪分布安装(依赖Hadoop)
- hadoop2.2.0伪分布安装
- hadoop1.0伪分布安装
- Hadoop/spark安装实战(系列篇3) Hadoop 伪分布模式安装
- Spark的伪分布安装和wordcount测试
- spark伪分布standalone搭建
- Hadoop2.6深入伪分布安装(CentOS 6.5)
- (5)HBase 1.2.6伪分布安装
- CentOS6.4-X64下Hadoop-2.0.0-CHD4伪分布安装(单机)!
- hadoop2.2.0伪分布下安装hive
- hadoop 2.4/6 伪分布安装
- hadoop1.0的伪分布安装
- hadoop1.0的伪分布安装
- ubuntu安装hadoop(伪分布)
- HBASE的伪分布安装(简单)
- Algorithm之路十三:Roman to Integer
- hadoop-hdfs 伪分布式搭建
- 如何解决如果已在 BIOS/固件设置中禁用 Intel VT-x,或主机自更改此设置后从未重新启动,则 Intel VT-x
- 是否做编程笔记的思考
- Spring Security入门一
- (6)Spark 2.0.0 伪分布安装
- 正则法则判断手机格式
- win10 touchpad figure control function
- 技术团队人员管理:团队组建(1)
- 计算机网络知识
- sscanf详解
- 中国式直播行业出海:机会OR陷阱?
- LAMP架构及Mysql-5.6二进制免编译安装
- 导航条(参照冒险岛官网)12.12