Spark生态之Alluxio学习12--spark调用alluxio-1.3.0配置
来源:互联网 发布:北外网络教育 编辑:程序博客网 时间:2024/06/05 07:54
更多代码请见:https://github.com/xubo245/SparkLearning
Spark生态之Alluxio学习 版本:alluxio(tachyon) 1.3.0,spark-1.5.2,hadoop-2.6.0
1.解释
alluxio-0.7.1 启动的时候spark集群直接可以调用,但是alluxio-1.3.0需要自动配置
2.代码:
2.1 下载
http://www.alluxio.org/download 下选择:
alluxio spark client
或者:
http://downloads.alluxio.org/downloads/files/1.3.0/alluxio-1.3.0-spark-client-jar-with-dependencies.jar
2.2 配置
请添加如下代码到spark/conf/spark-defaults.conf:
spark.driver.extraClassPath /home/hadoop/cloud/alluxio-1.3.0/jar/alluxio-1.3.0-spark-client-jar-with-dependencies.jarspark.executor.extraClassPath /home/hadoop/cloud/alluxio-1.3.0/jar/alluxio-1.3.0-spark-client-jar-with-dependencies.jar
2.2 启动
重启spark集群
3.结果:
spark-shell可以操作alluxio集群
scala> val rdd1= sc.textFile("hdfs://Master:9000//xubo/project/SparkSW/input/D1Line.fasta")rdd1: org.apache.spark.rdd.RDD[String] = MapPartitionsRDD[1] at textFile at <console>:21scala> rdd1.countres0: Long = 78295 scala> rdd1.saveAsTextFile("alluxio://Master:19998/D1Line.fasta")
参考
【1】https://github.com/Alluxio/alluxio【2】http://www.alluxio.org/【3】http://spark.apache.org/docs/1.5.2/programming-guide.html【4】https://github.com/xubo245/SparkLearning
0 0
- Spark生态之Alluxio学习12--spark调用alluxio-1.3.0配置
- Spark生态之Alluxio学习11--alluxio-1.3.0集群配置
- Spark生态之Alluxio学习25--spark从HDFS和Alluxio读取时间比较
- Spark生态之Alluxio学习9---Auuxio(Tachyon)的优点
- Spark生态之Alluxio学习22--saveAsTextFile alluxio后count (有bug)
- Spark生态之Alluxio学习2---Spark从tachyon中读取文件
- Spark & Alluxio
- spark&&alluxio
- Spark生态之Alluxio学习24--分别读取HDFS和Alluxio的数据进行line count比较分析
- Spark生态之Alluxio学习8---集群版搭建问题之集群无法全部启动
- Spark生态之Alluxio学习1---单机版搭建和运行
- Spark生态之Alluxio学习3---机器重启后数据存储位置的变化
- Spark生态之Alluxio学习4---下载源码通过maven install安装失败记录
- Spark生态之Alluxio学习5--tachyon的几个问题(待解决)
- Spark生态之Alluxio学习6---集群版搭建和运行(Tachyon)
- Spark生态之Alluxio学习7--下载源码通过maven安装成功
- Spark生态之Alluxio学习10--集群问法全部启动问题解决
- Spark生态之Alluxio学习17--多次运行Space Usage增加
- poj 1703 Find them, Catch them
- java.lang.IllegalStateException: Can't change tag of fragment xxxFragment
- 关于flask中Role的解释
- php 二位数组排序方式
- Linux下gcc宏定义作用域
- Spark生态之Alluxio学习12--spark调用alluxio-1.3.0配置
- hduoj 2084
- ESAPI处理sql注入和xss攻击
- HarborRegistry——centos上使用docker-compose源码安装Harbor
- destoon系统 接入第三方短信平台
- 奇虎360归程大起底:终极猎手露面 平行入股两大核心平台
- 经典算法题:数字三角形寻找最大路径——动态规划和递归调用两种解法
- apache三种工作模式比较
- 分布式系列 - dubbo服务cmd telnet命令