spark-submit笔记

来源:互联网 发布:阿里云cdn加速 编辑:程序博客网 时间:2024/06/01 08:46

driver-memory 5G MEM driver内存大小,默认512M
executor-memory 5G MEM executor内存大小,默认1G
executor-cores 5 NUM 每个executor使用的内核数,默认为1
num-executors 5 NUM 启动的executor数量,默认是2个

关于Spark属性的优先权为:SparkConf方式 > 命令行参数方式 >文件配置方式

向YARN部署spark应用程序的时候,注意executor-memory的大小,其内存加上container要使用的内存(默认值是1G)不要超过NM可用内存,不然分配不到container来运行executor

RDD的每个分区分别存储为HDFS的每个block
rdd partition –> hdfs block

0 0