对Spark中Broadcast的理解

来源:互联网 发布:淘宝美德威萨克斯 编辑:程序博客网 时间:2024/06/02 03:12

用Broadcast广播的变量是只读变量,可以有效的保持数据的一致性。
Broadcast的Storage Level是MEMORY_AND_DISK方式,所以不会造成内存溢出。
Broadcast广播的变量只会在Executor中保存一份,同一个Executor中所有task共享该变量,可以有效的减少内存的开销。
这里写图片描述