关于Spark里面的RDD.mappartitions的问题

来源:互联网 发布:百视通网络电视直播 编辑:程序博客网 时间:2024/06/10 20:19
mappartitions的执行效率要比foreachpartitions高,但是对一个同样的RDD,mappartitions里面的call方法为什么不执行呢?这是懒加载的原因,只有在使用mappartitions的结果的时候,它才会真正去调用call方法执行,比如rdd.mappartitions.collect或者rdd.mappartitions.count