程序博客网 > 快盘关闭数据如何找回

Apache Avro简介

来源：互联网发布：快盘关闭数据如何找回编辑：程序博客网时间：2024/06/05 15:26

简介

Apache Avro是一个数据序列化方法。

Avro提供：

丰富的数据结构。
紧凑、高效的二进制数据格式。
容器文件，用于存储持久数据。
远程过程调用(RPC)。
易于集成到动态语言的特性。
无论是读写数据文件，还是使用或实现RPC协议，都无需代码生成。代码生成是一个优化选项且只对静态类型语言的实现有意义。

Schema

Avro依赖于schema。当读取Avro数据时，总是能够获取到写入该数据时用到的schema。这样一来，每次写入数据都无需多余的开销，进而加快序列化速度、减小序列的大小。在动态的、脚本式语言中使用Avro也会变得更加容易，因为数据配合它的schema可以进行完整的自我描述。

当Avro数据被存入一个文件时，它的schema也会随之存入。随后，文件可以被任何程序处理。如果读取数据的程序期望另一个schema，这也容易解决，因为两个schema同时可以获取到。

当把Avro用于RPC时，客户端和服务器在连接握手时互换schema。（这一点还可以优化，对于大部分调用而言，实际上不会传输schema）。客户端和服务器都拥有对方的全部的schema，因此，在通信中的命名域、缺失域、附加域等都可以很容易被处理。

Avro schema是使用JSON定义的。在已经存在JSON库的语言中实现起来会更加方便。

同类比较

Thrift、Protocol Buffers等也提供了和Avro类似的功能。Avro区别于它们的主要方面如下：

动态类型：Avro不要求代码生成。数据总是和schema一起，无需代码生成和静态数据类型等就可以完整解析。这有助于在多种语言中构建通用的数据处理方法。
无标记数据：由于读取数据时总可以获取到schema，因此，极少的类型信息会被编码到数据中。这样使得序列化之后的大小更小。
无手动分配的域标识：当一个schema发生变化，处理数据时新的和旧的schema都可以获取到。所以，二者的差异使用域名即可解决。

参考链接

原始英文链接：http://avro.apache.org/docs/1.8.1/

阅读全文

0 0

快盘关闭数据如何找回

快盘关闭数据如何找回

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子简单的办法千纸鹤简单简单做法简单挂衣柜简单的要求简单seo 国庆手抄报简单简单是什么意思胃涨怎么办简单的办法简单压力容器简单艾灸不生病简单的去雀斑方法去头皮屑的简单方法简单易学的现代舞毛坯房简单装饰简单的山水画简单好玩的手游怎么去汗毛简单的方法去眼袋的简单方法怎样简单瘦腿瘦腿的简单方法学习简单英语学扎简单的女生发型做什么小吃简单如何简单瘦肚子简单动画制作简单的网页制作简单学习韩语简单学英语口语如何简单祛痘简单的现代舞简单手工小制作简单易学的街舞简单家居小布艺简单韩语学习怎么简单去黑头全身美白的简单方法简单有效祛痘方法简单英语听力阳台种菜超简单简单的化妆步骤