spark上的scala学习笔记
来源:互联网 发布:c语言编程案例 编辑:程序博客网 时间:2024/05/19 05:32
1. 初始化
val sc = new SparkContext(master, appName, [sparkHome], [jars])
参数master指明集群的地址,是字符串,master可以是"local"--在本地单机运行,也可以是Spark或者Mesos集群的URL。
参数appName是Spark应用的名称,会在集群的web界面里显示出来。
参数sparkHome是spark的安装目录,集群内所有节点的Spark必须安装在同样的目录下。
参数jars是打包后的Spark应用,是本地目录,这些Jar包会被复制发送到集群内的所有节点执行。
如果是运行Spark Shell,执行
bin/spark-shell
shell交互模式直接初始化了SparkContext(spark程序入口)。因此在写代码的时候直接从sc后面开始写比如:
val textFile = sc.textFile("/user/hadoop/test.txt")这就会创建一个RDD。其中路径名是hdfs上的一个文件。
2.
0 0
- spark上的scala学习笔记
- Spark学习笔记2-Scala的类,对象等
- scala学习笔记5 spark-shell的简单操作
- 笔记:Spark上的机器学习
- spark学习笔记一:scala语言基础
- Spark学习笔记1-Scala基础语法
- Spark学习笔记4-Scala模式匹配
- Spark学习笔记 --- scala实现Spark wordcount例子
- 对spark和scala的进一步学习
- 学习scala和spark的一些内容
- spark高级数据分析-scala学习(学习笔记)
- 第74讲:从Spark源码的角度思考Scala中的模式匹配学习笔记
- Spark与Scala学习
- Spark学习--scala
- Spark下Scala学习
- Spark学习链接(Scala)
- 导入文章“Apache Spark学习:将Spark部署到Hadoop 2.2.0上”中给出的 assembly/target/scala-2.9.3/目录下的spark-assembly-0.8.
- spark学习笔记-spark上做kaggle的机器学习分类任务
- C语言计算程序持续时间
- 数字证书原理,公钥私钥加密原理
- POJ3468__A Simple Problem with Integers (线段树)
- 查看mysql版本的四种方法
- C语言编译全过程介绍
- spark上的scala学习笔记
- 网络编程浅析(一)
- 让python代码运行的更快
- 剑指offer之寻找丑数,待字闺中之序列生成分析
- ORCFile存储格式
- .net 3.5 HttpRequest 请求的url 网址 如何实现不转义
- 网络编程浅析(二)
- ruby学习_2
- 【已解决】 java.security.KeyStoreException: java.security.NoSuchAlgorithmException