spark-jobserver使用笔记
来源:互联网 发布:ipad音乐软件 方块 编辑:程序博客网 时间:2024/05/19 14:50
最近项目有用到spark-jobserver来提供对外服务,主要用到的是他的面向job和context管理的REST接口
一:部署安装
这里就不再赘述来,网上很多个例子,可以参考
http://www.cnblogs.com/xiongmaotailang/p/5649256.html
这篇博客的内容,觉得写的还是可以的。
需要注意的一点是spark的版本问题,还有使用maven依赖的时候job-server-api_2.10 的版本问题,(主要是使用新老接口的问题即使用SparkJob或者NewSparkJob,在curl 提交作业的时候会宝少包的问题.我使用的是0.5.1 接口使用的SparkJob)
二:使用
1)首先需要初始化spark context
这里写代码片curl -d "" 'ip:port/contexts/contextName?context-factory=spark.jobserver.context.SQLContextFactory'
- ip:ip地址
- port:jobserver端口
- contextName:自定义的context名字,后续执行会用到,也可以查询
使用该context的application - context-factory:初始化context
spark.jobserver.context.SQLContextFactory用来初始化SQLContext
spark.jobserver.context.HiveContextFactory用来初始化HiveContext
spark.jobserver.context.DefaultSparkContextFactory用来初始化SparkContext
spark.jobserver.context.StreamingContextFactory用来初始化StreamingContext
2)上传jar包
curl --data-binary @/XXXX.jar ip:port/jars/appName
- /xxxx.jar:jar包绝对路径
- ip:port ip+端口
- appName:自定义job名称
3)运行程序
curl -d "input.string= \"{\"aa\":13}\" " "ip:port/jobs?appName=XXX&classPath=XXX"
➜ sparkjobserver curl -d "input.string= \"{\"aa\":13}\" " "localhost:8090/jobs?appName=mp_report&classPath=com.jfbank.data.BeginProject"{ "status": "STARTED", "result": { "jobId": "c9eb7f44-9c8e-45aa-a50f-18209adb743b", "context": "32137c4e-com.jfbank.data.BeginProject" }}%
- 我这里输入的是json串,注意写法。否则会报错
- appName是上边定义好的名字
- classPath是你的入口类地址
4)查看结果
curl localhost:8090/jobs/jobId
- jobid是上边的步骤得到
也可以
curl -d "input.string = a b c a b see" "localhost:8090/jobs?appName=test&classPath=spark.jobserver.WordCountExample&context=test-context&sync=true"
- 添加context= 和sync= 立即得到结果
三:优化
后续补充
- 列表内容
阅读全文
0 0
- spark-jobserver使用笔记
- Spark JobServer 安装使用
- 安装与使用 Spark-jobServer
- Spark JobServer简介
- 「·部署·」安装与使用 Spark-jobServer
- Spark as a Service之JobServer初测
- Spark as a Service之JobServer部署
- Spark as a Service之JobServer初测
- Spark as a Service之JobServer初测
- Spark JobServer实例以及上传运行
- Spark jobServer搭建+提交作业执行
- Spark使用笔记汇总
- spark学习笔记:使用maven编译spark
- Learning Spark笔记6-使用key,value
- Hadoop、spark的一些基本使用笔记
- spark学习笔记:使用API初始化SparkContext
- [2].Spark 学习笔记 使用java ---PageRank
- [3].Spark 学习笔记 使用java ---explode
- jzoj3520 原根
- yii安装详解
- bootstrap checkbox ratio 元素换行对齐的问题
- struts2是如何启动的?
- 图片选择和图片压缩
- spark-jobserver使用笔记
- kotlin项目开发总结
- 题目学习——hduoj-2136
- Jdk类库注解
- Unity3D的四种坐标系
- 数据结构与算法——希尔排序
- struts2框架的核心控制器是什么?它有什么作用?
- Python——psutil的使用(收集系统基础信息)
- Apache Hadoop与第三方Hadoop-CDH,HDP,MapR的分析与比较