spark的安装及测试
来源:互联网 发布:网络维保服务 编辑:程序博客网 时间:2024/06/14 15:57
Spark 会用到 HDFS 与 YARN,因此请先安装Hadoop,安装haoop见以前的文档
下载对应你hadoop版本的spark包,上传解压
授权:
sudo chown -R hadoop:hadoop ./spark位置
环境配置:vim /etc/profile 将spark的位置配置进去
export SPARK_HOME=/data/spark-1.5.2-bin-hadoop2.6
export PATH=$PATH:$SCALA_HOME/bin:$SPARK_HOME/sbin
使生效,特别注意是sbin不是bin
source /etc/profile
配置conf/slaves
修改cp conf/slaves.template conf/slaves
在slaves里面添加spark要部署的位置
vim conf/slaves 加入slave配置节点
master
slave01
slave02
cp ./conf/spark-env.sh.template ./conf/spark-env.sh
修改这个文件vim spark-env.sh
加入Spark环境配置内容,设置192.168.32.129(master)为Master节点
export SPARK_MASTER_IP=master
将配置好的spark分发到各个节点(slave01和slave02),hadoop为不需要输入密码那个用户$scp -r spark名 hadoop@slave01:spark放置位置
$scp -r spark名hadoop@slave02:spark放置位置
Spark的测试
先启动hadoop
Sbin/start-all.sh
在启动spark
Sbin/start-all.sh
可以看一下是否都启动起来了
去各个节点看jps里面是否有
主节点:Worker和Master启动
其他的节点work应该启动了:
在就是用浏览器打开看
ip:8080:是spark集群的界面
启动测试:
Spark shell 是spark自带的一个快速原型开发的工具,在spark目录下面的bin目录下面
在spark shell中做测试:
bin/spark-shell
启动后会有scala的命令符:
界面 IP:4040界面sparkweb ui的界面
可以用命令进行测试了:scala的基本命令在其他的文章中有介绍;
选择一个文件上传到hdfs
进行下spark的测试:
如果hdfs里面有文件直接用,如果没有,要加进去
eg1:
eg2:简单的几个比较特别的用法
toDebugString用于展示操作过程
eg3:排序,换位置:
在idea中写scala的jar
在IDEA\eclipse\myeclipse 中直接运行或者打成jar运行
可以参考文档
http://www.cnblogs.com/shishanyuan/p/4721120.html
- spark的安装及测试
- Spark的安装配置以及初步测试
- Spark安装 测试
- 提交任务到spark集群及spark集群的安装
- hive on spark的安装及问题
- Spark-SQL的安装及使用
- Spark-SQL--Thrift的安装及使用
- Openfire、Spark的安装及配置
- spark standalone的安装及使用
- Linux下的Spark安装及使用
- Linux下的Spark安装及使用
- Spark 安装 及 HelloWorld
- Spark安装及部署
- libmemcached的安装及测试
- Kafka的安装及测试
- kaldi 的安装及测试
- zeppelin 安装使用,测试spark,spark sql
- Spark的几种运行模式及shell测试
- 纹理映射基础
- Mac OS X下VirtualBox如何对硬盘进行扩容
- Xml学习
- 如何制作微课视频?使用NN三分屏软件3步完成
- iOS开发图片合成,多张图片合成一张图片
- spark的安装及测试
- iOS开发之UIView常用的一些方法小记之setNeedsDisplay和setNeedsLayout
- oracle体系结构
- Boostrap常用颜色的class,可用于文字和按钮等
- 深度学习 14. 深度学习调参,CNN参数调参,各个参数理解和说明以及调整的要领。underfitting和overfitting的理解,过拟合的解释。
- 将二维数组的某一行传入到函数中
- word2Vec--(1) nltk实现简单的切词,情感分析,文本相似度(TF-IDF)
- jvisualvm 远程监控centos上的elasticsearch碰到的问题
- SQL SERVER【非域环境】同步复制(事务)之准备篇(1)