spark性能调优三--shuffle调优

来源:互联网 发布:方太云魔方的缺点知乎 编辑:程序博客网 时间:2024/06/13 22:10

shuffle原理

001.PNG-42.2kB

002.PNG-66.5kB

003.PNG-95.8kB

一,合并map端输出文件

SparkConf conf = new SparkConf()                .setAppName(Constants.SPARK_APP_NAME_SESSION)                .setMaster("local")                .set("spark.default.paralelism", "500")                .set("spark.locality.wait","10")                .set("spark.storage.memoryFraction","0.5")                .set("spark.shuffle.consolidateFiles", "true")                .set("spark.serializer","org.apache.spark.serializer.KryoSerializer")                .registerKryoClasses(new Class[]{CategorySortKey.class});

001.PNG-39.6kB

002.PNG-81.4kB

003.PNG-84.1kB

004.PNG-73.3kB

005.PNG-31kB

006.PNG-56.9kB

二,调节map端缓存大小和reduce端缓存占比

001.PNG-40.9kB

002.PNG-31.5kB

003.PNG-71.4kB

004.PNG-109kB

005.PNG-79.5kB

三,HashShuffleManage和SortedShuffleManage的调节

001.PNG-34.8kB

002.PNG-77.8kB

003.PNG-69.4kB

004.PNG-115.3kB

0 0
原创粉丝点击