Flink广播的使用
来源:互联网 发布:inc在单片机什么意思 编辑:程序博客网 时间:2024/05/23 01:23
官网参考地址:https://ci.apache.org/projects/flink/flink-docs-release-1.2/dev/batch/index.html#broadcast-variables
广播的定义:
Broadcast variables allow you to make a data set available to all parallel instances of an operation, in addition to the regular(常规) input of the operation. This is useful for auxiliary(辅助的) data sets, or data-dependent parameterization. The data set will then be accessible at the operator as a Collection.
- Broadcast: broadcast sets are registered by name via
withBroadcastSet(DataSet, String)
可以使用withBroadcastSet方法,通过名字注册一个广播
- Access: accessible via
getRuntimeContext().getBroadcastVariable(String)
at the target operator.
使用
getRuntimeContext().getBroadcastVariable(String)
方法根据名字获取广播变量
package com.daxinimport org.apache.flink.api.common.functions.RichMapFunctionimport org.apache.flink.api.scala._import org.apache.flink.api.scala.extensions._import org.apache.flink.configuration.Configurationimport scala.collection.JavaConverters._ //asScala需要使用隐式转换/** * Created by Daxin on 2017/4/16. */object Broadcast { def main(args: Array[String]) { val env = ExecutionEnvironment.getExecutionEnvironment val toBroadcast = env.fromElements(1, 2, 3) val data = env.fromElements("1", "2", "5") /** * 如下是RichMapFunction的注释: * Rich variant of the MapFunction. As a RichFunction, it gives access to * the RuntimeContext and provides setup and teardown methods: * RichFunction.open(org.apache.flink.configuration.Configuration) and RichFunction.close(). * <br>RichMapFunction是MapFunction的变体,RichFunction可以访问运行时上下文(RuntimeContext) * 并提供开启和关闭方法 * <br> */ val result = data.map(new RichMapFunction[String, String]() { var broadcastSet: Traversable[Integer] = null override def open(config: Configuration): Unit = { // 3. Access the broadcasted DataSet as a Collection broadcastSet = getRuntimeContext().getBroadcastVariable[Integer]("broadcastSetName").asScala } def map(in: String): String = { //... if (broadcastSet.toList.contains(in.toInt)) in //随便简单返回字符串 else in + " " + broadcastSet.toList.size + " " + broadcastSet.toList.contains(in) + " " + broadcastSet.toList(0).getClass //随便简单返回 } }).withBroadcastSet(toBroadcast, "broadcastSetName") // 2. Broadcast the DataSet result.print() }}
由于广播的获取是根据名字的,所以需要注册和获取时候名字一致!关于广播完整实例可以参考:KMeans Algorithm
注意:
由于广播变量保存在集群的每一个节点的内存中,因此广播变量不应该太大,对于简单的变量像标量值,可以使该变量或者参数成为函数闭包的一部分,或者使用org.apache.flink.api.scala.DataSet#withParameters方法通过Config传递。
0 0
- Flink广播的使用
- Flink关于加速器的使用
- Broadcast广播的使用
- android 广播的使用
- 广播的使用步骤
- android 广播的使用
- android 广播的使用
- android 广播的使用
- android 广播的使用
- android 广播的使用
- 广播接收器的使用
- 【BroadCastReceiver】广播的使用
- Broadcast广播的使用
- Android的广播使用
- 广播的使用
- 广播的基本使用
- 广播的正确使用
- 广播接收器的使用
- MySQL高可用架构InnoDB Cluster (和NDB Cluster是两码事)
- 超时机制、断路器模式简介
- HorizontalRefresh 一个可以左右拖动刷新的控件
- 解决vmware虚拟机策略太旧的方法
- tarjan算法--求无向图的割点和桥
- Flink广播的使用
- swift学习笔记0
- http://www.suthink.com/ 商标 世誉鑫诚 问问,免费注册
- android调试+及JNI相关
- MySQL查看表占用空间大小
- C++ 哈夫曼树(压缩、加密实现代码)
- Java实现Kafka读写笔记
- 阿里巴巴Java开发手册-编程规约
- swift学习笔记1 操作符