kafka consumer 如何设置每次重启时从最新数据开始读取
来源:互联网 发布:淘宝店铺公告图片尺寸 编辑:程序博客网 时间:2024/06/07 06:07
最近在做实时报警的机制,显然我需要程序每次重启时都读取最新数据。但是寻找了半天无论是kafka的java客户端还是python客户端都没有这样的设置参数。没办法只能自己实现了,思路有两种。
- 直接操作zookeeper,因为kafka默认的consumer以及offset的信息是存贮在zookeeper中的,我们只要将zookeeper中相应的文件夹删掉,再连接kafka时我们就像新的consumer一样,会从最新数据开始读取
- 使用seek_to_end函数,seek_to_end会直接将位置定位到最新数据。但是在之前需要poll一次数据,不然会报没有分配partition的错误。这说明我们的框架也是懒加载的,只有在具体poll数据的时候才会分配partition。kafka-pyhton的样例代码如下:
from kafka import KafkaConsumer
consumer = KafkaConsumer('test', group_id='zhy_flow',
max_poll_records=10)
res = consumer.poll(10)
consumer.seek_to_end()
for msg in consumer:
print (msg)
阅读全文
0 0
- kafka consumer 如何设置每次重启时从最新数据开始读取
- 大数据生态系统基础:Apache Kafka基础(三):最新kafka编程入门:Consumer
- kafka consumer防止数据丢失
- kafka consumer防止数据丢失
- python kafka producer consumer redis数据从kafka发送写人redis
- sql读取从N开始数据
- matlab从某一行开始读取数据
- kafka consumer
- Kafka-Consumer
- Kafka Consumer
- SparkStream从kafka读取数据编码问题(Java)
- docker 搭建 ELK,logstash 从 kafka读取数据
- Word2010如何从正文开始设置页码
- 如何从任意页开始设置页码
- flume 读取kafka 数据
- presto读取kafka数据
- SparkStreaming读取Kafka数据
- Kafka之Consumer获取消费数据全过程图解
- Apsara Clouder云计算专项技能认证的网站建设-部署与发布,你知道吗?
- Java空指针异常
- Mathematics for computer science-Patterns of Proof
- View绘制流程
- 20171023模拟赛总结
- kafka consumer 如何设置每次重启时从最新数据开始读取
- Java
- Tinker热修复(命令行接入——未知BUG--.java文件修改不成功)
- 嵌入式操作系统 uC/OS-II V2.86 版本的bug
- vue简单实例(todolist)
- CSS3
- 自然语言处理2---jieba分词
- Python如何使用 *arg 和 **kwargs
- CentOS系统安装JDK1.8