spark上的scala学习笔记

来源：互联网发布：c语言编程案例编辑：程序博客网时间：2024/05/19 05:32

1. 初始化

val sc = new SparkContext(master, appName, [sparkHome], [jars])

参数master指明集群的地址，是字符串，master可以是"local"--在本地单机运行，也可以是Spark或者Mesos集群的URL。
参数appName是Spark应用的名称，会在集群的web界面里显示出来。
参数sparkHome是spark的安装目录，集群内所有节点的Spark必须安装在同样的目录下。
参数jars是打包后的Spark应用，是本地目录，这些Jar包会被复制发送到集群内的所有节点执行。

如果是运行Spark Shell，执行

bin/spark-shell

shell交互模式直接初始化了SparkContext（spark程序入口）。因此在写代码的时候直接从sc后面开始写比如：

val textFile = sc.textFile("/user/hadoop/test.txt")

这就会创建一个RDD。其中路径名是hdfs上的一个文件。

0 0

spark上的scala学习笔记
Spark学习笔记2-Scala的类，对象等
scala学习笔记5 spark-shell的简单操作
笔记：Spark上的机器学习
spark学习笔记一：scala语言基础
Spark学习笔记1-Scala基础语法
Spark学习笔记4-Scala模式匹配
Spark学习笔记 --- scala实现Spark wordcount例子
对spark和scala的进一步学习
学习scala和spark的一些内容
spark高级数据分析-scala学习（学习笔记）
第74讲：从Spark源码的角度思考Scala中的模式匹配学习笔记
Spark与Scala学习
Spark学习--scala
Spark下Scala学习
Spark学习链接(Scala)
导入文章“Apache Spark学习：将Spark部署到Hadoop 2.2.0上”中给出的 assembly/target/scala-2.9.3/目录下的spark-assembly-0.8.
spark学习笔记－spark上做kaggle的机器学习分类任务
C语言计算程序持续时间
数字证书原理,公钥私钥加密原理
POJ3468__A Simple Problem with Integers (线段树）
查看mysql版本的四种方法
C语言编译全过程介绍
spark上的scala学习笔记
网络编程浅析（一）
让python代码运行的更快
剑指offer之寻找丑数，待字闺中之序列生成分析
ORCFile存储格式
.net 3.5 HttpRequest 请求的url 网址如何实现不转义
网络编程浅析（二）
ruby学习_2
【已解决】 java.security.KeyStoreException: java.security.NoSuchAlgorithmException