云星数据---Apache Flink实战系列(精品版)】:Flink其他操作及内容001-Flink基于流的SessionWindow操作001
来源:互联网 发布:海知智能孙胜男 编辑:程序博客网 时间:2024/06/16 22:09
一、数据流和sessionc窗口
1.数据流
1.用户上京东购物,会进行一系列的操作,比如(点击、浏览、搜索、购买、付款等),用户的操作可以被记录为用户操作数据流。2.京东上的用户会同时有多个,每个用户的操作都是独立的,随机的,因此用户之间的行为没有必然联系,没有统一规律。
2.会话窗口(Session Windows)
2.1会话窗口概念
1.用户的行为有时是一连串的,形成的数据流也是一连串的2.我们把每一串称为一个session,不同的用户的session划分结果是不一样的。3.我们把这种window称作SessionWindow
2.2会话窗口gap
1.SessionWindow中的Gap是一个非常重要的概念,它指的是session之间的间隔。2.如果session之间的间隔大于指定的间隔,数据将会被划分到不同的session中。 比如,设定5秒的间隔,0-5属于一个session,5-10属于另一个session
2.1会话窗口设定
// event-time session windowsinput .keyBy(<key selector>) .window(EventTimeSessionWindows.withGap(Time.minutes(10))) .<windowed transformation>(<window function>)// processing-time session windowsinput .keyBy(<key selector>) .window(ProcessingTimeSessionWindows.withGap(Time.minutes(10))) .<windowed transformation>(<window function>)
阅读全文
1 0
- 云星数据---Apache Flink实战系列(精品版)】:Flink其他操作及内容001-Flink基于流的SessionWindow操作001
- 云星数据---Apache Flink实战系列(精品版)】:Flink其他操作及内容002-Flink基于流的windowAndFunction操作001
- 云星数据---Apache Flink实战系列(精品版)】:Flink其他操作及内容003-flink的背压机制001
- 云星数据---Apache Flink实战系列(精品版)】:Flink其他操作及内容004-flink的背压机制002
- 云星数据---Apache Flink实战系列(精品版)】:Flink流处理API详解与编程实战003-Flink基于流的window操作001
- 云星数据---Apache Flink实战系列(精品版)】:Flink流处理API详解与编程实战004-Flink基于流的window操作002
- 云星数据---Apache Flink实战系列(精品版)】:Flink流处理API详解与编程实战005-Flink基于流的window操作003
- 【云星数据---Apache Flink实战系列(精品版)】:Flink基础--001:flink介绍
- 【云星数据---Apache Flink实战系列(精品版)】:Flink流处理API详解与编程实战001-Flink基于流的wordcount示例001
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink实战基础006--flink分布式部署001
- 云星数据---Apache Flink实战系列(精品版)】:Flink流处理API详解与编程实战002-Flink基于流的wordcount示例002
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink实战基础002--flink特性:流处理特性介绍
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink实战基础003--flink特性:流处理,批处理珠联璧合
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink高级特性与高级应用001-Flink的内存管理001
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink高级特性与高级应用004-Flink的作业调度情况001
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink实战基础005--flink特性:flink的生态系统和Hadoop生态系统
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink实战基础007--flink分布式部署002
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink实战基础008--flink分布式部署003
- Episode Three: ROI区域图像叠加and线性图像混合
- Android 8.0安装apk
- 个人博客csdn开园
- WeixiStyle Yii2 RESTful API 开发
- leetcode: 83. Remove Duplicates from Sorted List
- 云星数据---Apache Flink实战系列(精品版)】:Flink其他操作及内容001-Flink基于流的SessionWindow操作001
- numpy数组切片索引的详细讲解
- Java配置----JDK开发环境搭建及环境变量配置
- (译)package.json详解
- Tensorflow实战学习(三十二)【实现Google Inception Net】
- leetcode: 84. Largest Rectangle in Histogram
- 全国首款二级分销小程序上线
- 干货丨盘点人工智能从业者必备的10个深度学习方法
- Android Init language