flink增量读文本数据
来源:互联网 发布:自建服务器绑定域名 编辑:程序博客网 时间:2024/06/07 15:47
如下代码可以实现增量从文件地址读数据,读完一次之后,若你对文件增加了数据,它会相应的读出来。
方法内有三个属性,分别是WatchType.ONLY_NEW_FILES:处理整个文件,PROCESS_ONLY_APPENDED只处理相应的增加部分,REPROCESS_WITH_APPENDED :当文件内容增加了之后会重新处理整个文件。
在新的flink版本里面,只有两种模式了:PROCESS_ONCE以及PROCESS_CONTINUOUSLY.分别对应处理一次以及增量处理。
大家可以根据自己的需求选择模式。
import org.apache.flink.api.common.typeinfo.BasicTypeInfo;import org.apache.flink.api.common.typeinfo.TypeInformation;import org.apache.flink.api.java.io.TextInputFormat;import org.apache.flink.core.fs.Path;import org.apache.flink.streaming.api.datastream.DataStream;import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;import org.apache.flink.streaming.api.functions.source.FileProcessingMode;/** * Created by master on 8/17/17. */public class read_append_text { public static void main(String[] args) throws Exception { Path pa=new Path("/home/master/qingshu"); TextInputFormat format = new TextInputFormat(pa); BasicTypeInfo typeInfo = BasicTypeInfo.STRING_TYPE_INFO; format.setCharsetName("UTF-8"); StreamExecutionEnvironment env=StreamExecutionEnvironment.getExecutionEnvironment(); DataStream<String> st=env.readFile(format,"/home/master/qingshu", FileProcessingMode.PROCESS_CONTINUOUSLY, 1L,(TypeInformation)typeInfo); st.print(); env.execute(); }}
阅读全文
0 0
- flink增量读文本数据
- Flink批处理中的增量迭代
- 【云星数据---flink实战系列001】:flink简介
- 【云星数据---flink实战系列001】:flink简介
- Flink
- 【云星数据---Apache Flink实战系列(精品版)】:Flink基础--001:flink介绍
- ssis数据增量抽取
- LO增量数据加载
- 数据增量抽取
- solr增量导入数据
- Sqoop数据增量导入
- kettle增量抽取数据
- 增量同步数据
- Flink批处理优化器之数据属性
- Flink读写数据(hdfs)(DataSet)
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink实战基础002--flink特性:流处理特性介绍
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink实战基础003--flink特性:流处理,批处理珠联璧合
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink实战基础006--flink分布式部署001
- 求字符串的重复子字符串的最小周期
- while(cin >>)的输入停止与错误问题
- VUE计算属性
- 生产者/消费者模型
- 基础数论算法(⑩) Catalan数与Stirling数
- flink增量读文本数据
- Java字符串的内存分配
- mysql数据库引擎:MyISAM和InnoDB(性能优化)
- HDOJ 6047 Maximum Sequence(单调队列)
- 获取当前时间及格式化
- QT编写视频监管平台(开源)
- 标题文章测试
- (字符串,map的使用)What Are You Talking About--HDOJ
- (日志管理-1)关于日志的扯淡