Kafka官方文档翻译(2016-11-16)
来源:互联网 发布:dhtmlhistory.js下载 编辑:程序博客网 时间:2024/04/26 03:33
看了很多翻译文档,可能是版本的问题吧,感觉驴唇不对马嘴的。。。索性自己整理下,供大家学习吧!完全尊重原文档的翻译,一句一句可以对照的,若有纰漏,烦请指出。原英文文档链接:http://kafka.apache.org/intro.html
介绍
Kafka™是一个分布式流平台( distributed streaming platform)。但它实际是什么意思呢?
我们认为流平台具有三个关键功能:
1.它允许您发布和订阅记录流。 在这方面,它类似于消息队列或企业消息系统。
2.它允许您以容错方式存储记录流。
3.它允许您在记录发生时处理流记录。
什么是Kafka的优势?
它用于两大类应用程序:
1.构建可靠地在系统或应用程序之间获取数据的实时的流数据通道
2.构建变换或响应数据流的实时流应用程序
要了解Kafka如何做这些事情,让我们从下而上地探索和探索Kafka的能力。
首先几个概念:
·Kafka作为一个群集在一个或多个服务器上运行。
·Kafka集群存储的记录流叫做主题(topic)。
·每个记录由一个键,一个值和一个时间戳组成。
Kafka有四个核心API:
·生产者API允许应用程序将流记录发布到一个或多个Kafka 主题(topic)。
·Consumer API允许应用程序订阅一个或多个主题(topic),并处理为其生成的记录流。
·Streams API允许应用程序充当流处理器(processor),消耗来自一个或多个主题(topic)的输入流并产生到一个或多个输出主题的输出流,有效地将输入流转换为输出流。
·Connector API允许构建和运行可重用的生产者或消费者,将Kafka主题(topic)连接到现有应用程序或数据系统。 例如,关系数据库的连接器可能捕获对表的每个更改。
在Kafka中,客户端和服务器之间的通信使用简单的高性能语言无关的TCP协议来完成。 此协议版本化,并保持与旧版本的向后兼容性。 我们为Kafka提供Java客户端,但客户端提供多种语言。
主题(topic)和日志
让我们首先深入Kafka提供的记录流的核心抽象 - 主题(topic)。
主题(topic)是发布记录的类别或Feed名称。 主题在Kafka总是多用户; 也就是说,主题可以有零个,一个或多个订阅其的数据的消费者(consumer)。
对于每个主题,Kafka集群维护一个分区日志,如下所示:
事实上,每个消费者保留的唯一元数据是消费者在日志中的偏移或位置。这种偏移(offset)由消费者控制:通常消费者在读取记录时线性地提前其偏移,但是实际上,由于位置由消费者控制,所以它可以按照喜欢的任何顺序来消费记录。例如,消费者可以重置到较旧的偏移以重新处理来自过去的数据或者跳到最近的记录并开始从“现在”消费。
这些功能的组合意味着Kafka消费者非常灵活 - 他们可以来来去去,对群集或其他消费者没有太大的影响。例如,您可以使用我们的命令行工具“拖动”任何主题的内容,而不更改现有消费者使用的内容。
日志中的分区有几个目的。 首先,它们允许日志扩展到适合单个服务器的大小。每个单独的分区必须适合管理它的服务器,一个主题可能有许多分区,因此它可以处理任意数量的数据。第二,它们作为并行性的单位。
分布式
生产者
消费者
- Kafka官方文档翻译(2016-11-16)
- kafka官方文档翻译-introduction
- kafka官方文档翻译-design
- Kafka官方文档翻译——简介
- Kafka官方文档翻译(三)Kafka Streams的使用
- Kafka官方文档翻译(一)产品概述
- Kafka官方文档翻译(二)快速入门
- kafka官方Introduction翻译
- kafka入门官方文档
- kafka官方文档
- Storm Kafka Integration (0.10.x+)官方文档翻译:storm与kafka整合
- kafka部分文档翻译
- 【翻译】Xibo官方文档11-Layout-Introduction
- JNI 官方文档翻译
- FullCalendar 官方文档翻译
- monkeyrunner官方文档翻译
- FullCalendar 官方文档翻译
- FullCalendar 官方文档翻译
- Xcode清除缓存及多余证书
- IPC机制学习导航
- 常用的节点类型常量
- 字段修改
- 负载均衡(二)nginx
- Kafka官方文档翻译(2016-11-16)
- 分享一个上传图片,图片压缩Unsupported Image Type解决方案
- 事务管理
- Android中selector的使用
- sql查询所有数据并把中间数据靠前
- 公告牌技术
- python抓取动态数据
- Android插件化开发基础之Java动态代理(proxy)机制的简单例子
- Android4种网络连接方式HttpClient、HttpURLConnection、OKHttp、Volley