设置sparkstreaming每个batch处理消息数量
来源:互联网 发布:格子 玻尔兹曼 软件 编辑:程序博客网 时间:2024/06/05 07:52
场景:kafka中积累了大量未处理的数据,启动sparkstreaming处理数据时,可以指定起始处理的offset位置,
但是untiloffset默认是所有数据的最大offset(会调用OffsetRequest向kafka服务器请求)。
在数据量巨大的情况下,可能会带来内存方面的问题。同时首个batch的处理时间会非常的长,万一期间再次出现问题,又需要重头开始处理。所以理想的情况下是指定每个batch处理的数据数量。
设置方法是修改spark.streaming.kafka.maxRatePerPartition的值secsPerBatch。
这样每个batch处理的数量就为 batchDuration * secsPerBatch
batchDuration为JavaStreamingContext中指定的1s
JavaStreamingContextjssc = new JavaStreamingContext(sparkConf, Durations.seconds(1));
0 0
- 设置sparkstreaming每个batch处理消息数量
- 每个窗口单独处理消息的例子源码
- ORA-02020的处理,dblink超出数量的设置
- 批量处理(Batch processing
- sparkStreaming
- sparkStreaming
- sparkstreaming
- SparkStreaming
- 巧用batch设置环境变量
- Spring Batch 环境设置
- kafka+sparkstreaming 获取每个分区的偏移范围
- SparkStreaming之TCP流式处理(netcat)
- ios UITabBar UITabBarItem 设置角标 数字 红点 未读消息数量
- 返回每个小时独立的IP数量
- SQL :每个会员第一次操作的数量
- 平均每个家庭生男孩的数量
- 摆脱在每个命令消息处理函数中的TRY和CATCH
- rabbitmq二---均匀分配消息给每个接收者,prefetchCount设置均匀分配的个数
- 如何POST一个JSON格式的数据给Restful服务
- 开源硬件资源
- js获取判断操作系统
- 字符串包含
- mac os x配置adb大局命令的方法
- 设置sparkstreaming每个batch处理消息数量
- MAC安装oh my zsh
- cocos2dx 4.3 ToggleVisibility
- HDU 1800 Flying to the Mars
- 用Quick-Cocos2d-x 3.3简单开发微信打飞机 -03 添加爆炸动画和子弹与敌机的碰撞
- 基于socket的ftp实现
- RxJava 操作符 just和from
- strpbrk和strcspn这两个函数的区别
- 创建链接