Spark + Hadoop-2.2.0 伪分布环境下的环境搭建
来源:互联网 发布:tplink端口转发不生效 编辑:程序博客网 时间:2024/04/29 19:27
上一次我介绍了,没有hadoop模式下的spark的安装,下面将要介绍基于hadoop伪分布模式下的spark环境的搭建,其中hadoop为hadoop-2.2.0的环境,系统为ubuntu-14.04
1.首先要确保spark已经成功解压安装,详情请查看上篇博文
http://blog.csdn.net/qiumianderen5/article/details/46400885
2.然后修改spark目录下conf里面的spark-env.sh 文件
(1)首先需要从 spark-env.sh.template 中创建一个新的spark-env.sh文件
cp spark-env.sh.template spark-env.sh
(2)然后修改spark-env.sh里面的参数
vim spark-env.sh
修改的内容:
export SCALA_HOME=/usr/local/share/scala/scala-2.10.4export JAVA_HOME=/usr/jdk1.7.0_51export SPARK_MASTER=localhostexport SPARK_LOCAL_IP=localhostexport HADOOP_HOME=/home/hadoop/hadoop/hadoop-2.2.0export SPARK_HOME=/home/hadoop/hadoop/spark-1.3.1export SPARK_LIBARY_PATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib:$HADOOP_HOME/lib/nativeexport YARN_CONF_DIR=$HADOOP_HOME/etc/hadoopexport SPARK_EXAMPLE_JAR=/home/hadoop/hadoop/spark-1.3.1/examples/target/spark-examples_2.10-1.3.1.jar
3.然后启动spark:
sbin/start-all.sh
4.如果需要启动HDFS或者YARN则需要转到hadoop中去启动相应的HDFS和YARN
启动HDFS:
start-dfs.sh
启动YARN:
start-yarn.sh
5.效果
其中的Master和Worker就是Spark的启动的进程
希望大家都能搭建成功
0 0
- Spark + Hadoop-2.2.0 伪分布环境下的环境搭建
- Hadoop 2.2.0 伪分布环境搭建
- 单机伪分布下的hadoop+spark 环境配置
- hadoop 伪分布的环境搭建
- hadoop伪分布环境搭建
- hadoop伪分布环境搭建
- hadoop伪分布环境搭建
- hadoop伪分布环境搭建
- hadoop 2.2.0 伪分布环境搭建(草稿)
- hadoop介绍以及伪分布环境搭建
- hadoop-2.5.2伪分布环境搭建
- hadoop-2.4.1伪分布环境搭建
- Hadoop伪分布环境搭建(Ubuntu)
- Linux环境搭建Hadoop伪分布模式
- Hadoop环境的搭建过程中的问题(伪分布)
- Ubuntu 14.04下hadoop 2.2.0 伪分布环境配置datanode不能启动的解决办法
- 从hadoop 2.2.2 伪分布模式搭建环境准备
- Hadoop在Unbunt环境下的伪分布模式搭建教程
- 使用PythonCharm简易安装python统计包及UnicodeDecodeError,numpy.distutils.systeminfo.blas/lapacknotfounderror
- 类模板相互引用的问题(错误:缺少类型说明符-假定为int。注意:C++不支持默认int)
- 约瑟夫问题(循环链表)
- jQuery中html()、val()、text()的区别; javascript中innerHTMl、innerText、outHTML的区别
- 移动开发入门
- Spark + Hadoop-2.2.0 伪分布环境下的环境搭建
- 【VB.NET机房重构】DataGridView数据显示
- 什么信息(新闻)值得关注
- Tomcat集群--基于Memcached的Session共享
- 不敢死队问题 (循环链表)
- 剑指offer 63 - 二叉搜索树的第K个节点
- Java线程(篇外篇):线程本地变量ThreadLocal
- 双向链表
- Linux常用打包压缩备份