Kafka消费者生产者实例

来源:互联网 发布:如何下载网站的源码 编辑:程序博客网 时间:2024/04/20 07:22

为了更为直观展示Kafka的消息生产消费的过程,我会从基于Console和基于Application两个方面介绍使用实例。Kafka是一个分布式流处理平台,具体来说有三层含义:

  1. 它允许发布和订阅记录流,类似于消息队列或企业消息传递系统。
  2. 它可以容错的方式存储记录流。
  3. 它可以处理记录发生时的流。

由于主要介绍如何使用Kafka快速构建生产者消费者实例,所以不会涉及Kafka内部的原理。一个基于Kafka的生产者消费者过程通常是这样的(来自官网):

Kafka生产者消费者

安装Kafka

从官网下载kafka_2.11-0.11.0.0.tgz,解压后安装到指定目录:

cd kafka_2.11-0.11.0.0tar -zxvf kafka_2.11-0.11.0.0.tgz -C pathToInstall

启动Kafka:

bin/kafka-server-start.sh config/server.properties

基于Console

创建Topic

bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic test

Producer发送消息

bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test

在控制台输入要发送的消息:

This is a messageThis is another message

Consumer接收消息

bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test --from-beginning

输入命令后可以看到控制台输出了刚才的消息:

This is a messageThis is another message

基于Application

单个consumer

生产者:

public class SimpleKafkaProducer {    public static void main(String[] args) {        Properties props = new Properties();        //broker地址        props.put("bootstrap.servers", "localhost:9092");        //请求时候需要验证        props.put("acks", "all");        //请求失败时候需要重试        props.put("retries", 0);        //内存缓存区大小        props.put("buffer.memory", 33554432);        //指定消息key序列化方式        props.put("key.serializer",                "org.apache.kafka.common.serialization.StringSerializer");        //指定消息本身的序列化方式        props.put("value.serializer",                "org.apache.kafka.common.serialization.StringSerializer");        Producer<String, String> producer = new KafkaProducer<>(props);        for (int i = 0; i < 10; i++)            producer.send(new ProducerRecord<>("test", Integer.toString(i), Integer.toString(i)));        System.out.println("Message sent successfully");        producer.close();    }}

消费者:

public class SimpleKafkaConsumer {    public static void main(String[] args) {        Properties props = new Properties();        props.put("bootstrap.servers", "localhost:9092");        //每个消费者分配独立的组号        props.put("group.id", "test");        //如果value合法,则自动提交偏移量        props.put("enable.auto.commit", "true");        //设置多久一次更新被消费消息的偏移量        props.put("auto.commit.interval.ms", "1000");        //设置会话响应的时间,超过这个时间kafka可以选择放弃消费或者消费下一条消息        props.put("session.timeout.ms", "30000");        props.put("key.deserializer",                "org.apache.kafka.common.serialization.StringDeserializer");        props.put("value.deserializer",                "org.apache.kafka.common.serialization.StringDeserializer");        KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props);        consumer.subscribe(Collections.singletonList("test"));        System.out.println("Subscribed to topic " + "test");        int i = 0;        while (true) {            ConsumerRecords<String, String> records = consumer.poll(100);            for (ConsumerRecord<String, String> record : records)                // print the offset,key and value for the consumer records.                System.out.printf("offset = %d, key = %s, value = %s\n",                        record.offset(), record.key(), record.value());        }    }}

先启动生产者,发送消息到broker,这里简单发送了10条从0-9的消息,再启动消费者,控制台输出如下:

消费结果

集群消费

以上的程序只是单生产者单消费者的场景,所谓集群消费就是同一个topic的消费可能有多个消费者消费,也称广播消费。集群消费只一种多线程或者多机器的消费方式。

要实现集群消费只需要为每个消费者指定不同的group.id就可以。由于代码比较简单就不贴了。

测试发现,当为了两个consumer(这里是两个进程)指定不同的group.id后,producer发送的消息两个consumer都能接受到,这很显然,集群消费嘛。为设置两个consumer的group.id为同一个的时候,只有一个消费者能消费者到。也就是说,kafka的消息只能由组中的单个用户读取。