大数据Kafka
来源:互联网 发布:重庆行知教育集团 编辑:程序博客网 时间:2024/04/30 15:43
1、Kafka下载:
wget https://archive.apache.org/dist/kafka/0.8.1/kafka_2.9.2-0.8.1.tgz
解压 tar zxvf kafka_2.9.2-0.8.1.tgz
由于kafka使用scala编写,需要下载scala相关的库
2、下载安装sbt:
wget http://repo.scala-sbt.org/scalasbt/sbt-native-packages/org/scala-sbt/sbt/0.13.1/sbt.rpm
如果报404错误,可以采取离线下载,再RZ到Linux中
安装方式有两种
yum install -y sbt-0.13.1.rpm 或 rpm -ivh sbt-0.13.1.rpm
3、 更新scala环境:
sbt update
sbt package
sbt assembly-package-dependency(这一步根据版本可以不执行)
4、配置config/server.properties
broker.id为依次增长的:0、1、2、3、4,集群中唯一id
log.dirs设置到大硬盘路径下
num.network.threads
num.partitions ,默认分区数
num.io.threads 建议值为机器的核数;
zookeeper.connect 设置为zookeeper Servers 列表,各节点以逗号分开
5、配置producer.properties和consumer.properties
producer.properties的配置:
metadata.broker.list=master:9092,slave1:9092…….
consumer.properties的配置:
zookeeper.connect=master:2181,slave1:2181…….
6、启动和测试Kafka
首先启动zookeeper集群;
Kafka 启动
在kafka的部署目录下,在各个节点上通过如下命令来启动:
$ nohup bin/kafka-server-start.sh config/server.properties &
[root@master ~]# jps
3098 ZooKeeperMain
3037 Kafka
创建topic:
bin/kafka-topics.sh –zookeeper master:2181,slave1:2181
–topic track_log –replication-factor 2 –partitions 2 –create
其中: –topic 定义topic名
–replication-factor 定义副本数
–partitions 定义分区数
进入ZK中查看创建的topic
查看全部Topic:
bin/kafka-topics.sh –zookeeper 192.168.1.107:2181,192.168.1.107:2181 –list
删除Topic:
./kafka-topics.sh –topic topicName –delete
–zookeeper 192.168.1.107:2181,192.168.1.107:2181
查看Topic明细:
./kafka-topics.sh –topic test –describe
–zookeeper 192.168.1.107:2181,192.168.1.107:2181
生产和消费
Productor:
bin/kafka-console-producer.sh –broker-list
192.168.1.107:9092,192.168.1.108:9092 –topic topicName
Consumer:
bin/kafka-console-consumer.sh
–zookeeper 192.168.1.107:2181,192.168.1.107:2181
–topic topicName –from-beginning
异常处理
报异常:
Failed to load class “org.slf4j.impl.StaticLoggerBinder”
解决方法:
下载slf4j-1.7.6.zip
wget http://www.slf4j.org/dist/slf4j-1.7.6.zip
解压
unzip slf4j-1.7.6.zip
把slf4j-nop-1.7.6.jar 包复制到kafka libs目录下面
配置文件config/server.properties 中配置项:
- 大数据Kafka
- 贫农的大数据之二(Kafka)
- Kafka在大数据生态系统中的价值
- 大数据技术之Kafka是什么
- 大数据系列之Kafka安装
- 大数据系列之kafka-java实现
- 大数据技术-消息队列-Kafka
- Apache Kafka:大数据的实时处理时代
- Apache Kafka:大数据的实时处理时代
- 大数据协作框架之kafka
- 大数据学习[10]:Kafka新手入门
- 大数据系列教程_分布式消息队列kafka
- 传统Active MQ与大数据下的分布式Kafka
- 大数据架构:flume+Kafka+Storm+HDFS 实时系统组合
- 大数据组件原理总结-Hadoop、Hbase、Kafka、Zookeeper、Spark
- 大数据_Kafka_搭建Kafka伪集群(本地集群)
- 大数据技术--kafka和flume的对比
- 大数据分析的技术栈(二)-Apache Kafka
- 第14周项目 2—数组类模板
- 在raspberry运行xibo
- weblogic解决Jar包冲突
- LeetCode-155.Min Stack
- 论big data 3.0取代SAP HANA的可行性
- 大数据Kafka
- C++ eof()函数相关应用技巧分享
- getCacheDir()、getFilesDir()、getExternalFilesDir()
- [读书笔记]《Java程序员修炼之道》
- SpringMVC 基于注解的Controller详解
- TableViewCell 复用解决
- Android学习笔记--GMS认证(常见的cts—fail及解决方法)
- iOS Autolayout之Masonry解读
- Unreal Engine4(虚幻4)学习心得-Ambient Cubemap 环境立方体贴图