在window上提交spark代码到远程测试环境上运行
来源:互联网 发布:伦敦生活 知乎 编辑:程序博客网 时间:2024/06/05 04:34
测试代码:
package sparkcore
import org.apache.spark.{SparkConf, SparkContext}
/**
* Created by chingy on 2017/10/2.
*/
object WordCount {
def main(args: Array[String]): Unit = {
//Executor memory 419430400 must be at least 471859200
val conf = new SparkConf().setAppName("WC").setMaster("spark://n1:7077").set("spark.executor.memory", "500m")
val sc = new SparkContext(conf)
//必须要指定jar包,否则运行时报序列化错误,照说jar里也没什么序列化的类吧,主要就项目的pom文件?
sc.addJar("file:///D:/WorksForScala/test/target/test-1.0-SNAPSHOT.jar")
sc.textFile("hdfs://n1:9000/hello").cache()
.flatMap(line => line.split("\t"))
.map(word => (word, 1))
.reduceByKey(_ + _)
.saveAsTextFile("hdfs://n1:9000/remoteUser/result")
}
}
1·本地用maven打包,并在运行程序中通过sc.addJar()进行设置
2·setMaster使用spark远程访问的schema
3·本地及hdfs的schema都要加上
参考网上文档:
1·远程测试需要指定jar包(java版本的):http://blog.csdn.net/xiaoshunzi111/article/details/77529175
2·spark的master支持的url:https://www.zhihu.com/question/23967309
- 在window上提交spark代码到远程测试环境上运行
- Eclipse提交代码到Spark集群上运行
- scala编写的Spark程序远程提交到服务器集群上运行
- 如何在window上把项目提交到github上
- 在Ambari上用rest提交Spark到Yarn上
- 在windows上使用eclipse提交Spark任务到Spark平台上
- 在windows上使用eclipse提交Spark任务到Spark平台上
- 用maven管理spark应用程序,提交到spark on yarn 集群上运行
- 在Mesos上运行Spark
- spark在集群上运行
- 在 YARN 上运行 Spark
- 在集群上运行Spark
- 在spark上运行scala代码,出现ClassNotFoundException
- 在spark上运行scala代码,出现ClassNotFoundException
- spark部署:在YARN上运行Spark
- 部署jar到spark上运行
- 确保测试代码不会在发布版上运行
- 从windows上提交代码到spark集群发现driver地址不通
- Qt Creator工作目录
- 线段树 or 树状数组求逆序对
- Python自动化运维笔记(六):使用smtplib模块发送电子邮件
- 将Excel列转为字符串存到数据库表中
- 什么是-持续集成
- 在window上提交spark代码到远程测试环境上运行
- CTU Open Contest 2016 Suspicious Samples(单调队列)
- Linux自定义命令别名配置
- 有树形依赖的背包问题
- LeedCode Longest Substring Without Repeating Characters
- 认识AS中的Gradle
- 51nod 1183 编辑距离
- Mybatis Cause: java.lang.ClassNotFoundException: Cannot find class: BaseResultMap
- 强大的vim配置文件,让编程更随意