Kafka笔记四之存储策略
来源:互联网 发布:c语言产生0 1的随机数 编辑:程序博客网 时间:2024/06/08 14:44
1.一个topic包含多个partition而message存储在partition当中,offset可以看作是message在partition中的id通过它kafka可以定位具体的message。
2.一个partition又是由多个segment(片段)组成,生产者发送消息给topic,broker收到消息后向partition中最后一个segment添加该消息,当segment达到一定大小后broker会创建新的segment。
3. 在server.properties文件中log.dirs=/opt/kafka_data指定了kafka数据的存储目录
图中的hello-0就是topic为hello,partition为0,一个partition一个文件夹。
Partition下会有很多个segment,每个片段文件名以此片段中最小的那个offset命名,分别包含index和log文件,index是索引文件log是数据文件,两个文件同名都是以最小的offset命名的。
假设查找hello-0中offset=1111的message,而目录下有[001000.index,001000.log]和[002000.index,002000.log]那么首先就可以确定应该存在于001000.log文件,因为1000是此文件中最小的offset,然后将索引文件001000.index读取到内存中,index文件采用的是稀疏索引即每隔一定数据字节建立一条索引比如0~100,101~200而offset=1111(1111-1000=111)此时可以确定在101~200这个区间中,这样就可以定位到message的大概位置从而比起全部读取数据效率要高。
- Kafka笔记四之存储策略
- Kafka之数据存储
- kafka 学习笔记(四)之Python客户端
- kafka学习笔记四:搭建Kafka集群
- Kafka学习之四 Kafka常用命令
- kafka之四 consumer 解析
- kafka之二 文件存储
- oracle学习笔记之四(存储过程)
- 本地存储策略之cookie
- SQL Server学习笔记之四(什么是数据库的备份策略)
- 《简约至上:交互式设计四策略》笔记
- 《简约至上,交互设计四策略》笔记
- Dubbo学习笔记(四)------策略
- Kafka 学习笔记(七)之Kafka Consistency
- kafka 数据删除策略
- kafka Partition分发策略
- Kafka分区策略浅谈
- 设计模式培训之四:策略模式
- 继承
- 内网和外网
- Sping-AOP:cglib动态代理与JDK动态代理的区别
- 59. Spiral Matrix II
- 数据库原理第一次作业
- Kafka笔记四之存储策略
- Linux下iptables原理
- python基础学习(1)
- Java IO
- RapidMiner 离散/缺失
- 蓝桥杯--基础练习:数列排序
- 每日一题 No.27 set容器的学习
- Scala中隐式转换整理
- IIC设备驱动程序(四)————IIC总线驱动程序框架分析