Protobuf 用法

来源:互联网 发布:大数据思维与决策 编辑:程序博客网 时间:2024/06/03 12:29

参考: http://blog.csdn.net/guyue35/article/details/51181845
以及 http://mikewang.blog.51cto.com/3826268/1432136

什么是Protobuf?

官方给出的是:
a language-neutral, platform-neutral, extensible way of serializing structured data for use in communications protocols, data storage, and more.

Protobuf => Protocol Buffers
实际上 protobuf是一个开源项目,它是鼎鼎大名的Google公司开发出来,并且在Google内部久经考验的一个消息格式。

Protobuf的优点

1,性能好,效率高

2,代码生成机制,数据解析类自动生成

3,支持向后兼容和向前兼容

4,支持多种编程语言(java,c++,python)

Protobuf的缺点

1, 应用不够广

2, 二进制格式导致可读性差(二进制格式)

3, 缺乏自描述

官方文档描述如下:for instance, protocol buffers would not be a good way to model a text-based document with markup (e.g. HTML), since you cannot easily interleave structure with text.

Protobuf消息定义

消息由至少一个字段组合而成,类似于C语言中的结构。每个字段都有一定的格式。
字段格式:限定修饰符① | 数据类型② | 字段名称③ | = | 字段编码值④ | [字段默认值⑤]

  • 限定修饰符包含 required\optional\repeated

Required

表示是一个必须字段,必须相对于发送方,在发送消息之前必须设置该字段的值,对于接收方,必须能够识别该字段的意思。发送之前没有设置required字段或者无法识别required字段都会引发编解码异常,导致消息被丢弃。

Optional

表示是一个可选字段,可选对于发送方,在发送消息时,可以有选择性的设置或者不设置该字段的值。对于接收方,如果能够识别可选字段就进行相应的处理,如果无法识别,则忽略该字段,消息中的其它字段正常处理。---因为optional字段的特性,很多接口在升级版本中都把后来添加的字段都统一的设置为optional字段,这样老的版本无需升级程序也可以正常的与新的软件进行通信,只不过新的字段无法识别而已,因为并不是每个节点都需要新的功能,因此可以做到按需升级和平滑过渡。

Repeated

表示该字段可以包含0~N个元素。其特性和optional一样,但是每一次可以包含多个值。可以看作是在传递一个数组的值。
  • 数据类型

    Protobuf定义了一套基本数据类型。几乎都可以映射到C++\Java等语言的基础数据类型.

  • 字段名称

    字段名称的命名与C、C++、Java等语言的变量命名方式几乎是相同的。
    protobuf建议字段的命名采用以下划线分割的驼峰式。例如 first_name 而不是 firstName.

  • 字段编码值

    有了该值,通信双方才能互相识别对方的字段。当然相同的编码值,其限定修饰符和数据类型必须相同。
    编码值的取值范围为 1~2^32(4294967296)。
    其中 1~15的编码时间和空间效率都是最高的,编码值越大,其编码的时间和空间效率就越低(相对于1-15),当然一般情况下相邻的2个值编码效率的是相同的,除非2个值恰好实在4字节,12字节,20字节等的临界区。比如15和16.
    1900~2000编码值为Google protobuf 系统内部保留值,建议不要在自己的项目中使用。
    protobuf 还建议把经常要传递的值把其字段编码设置为1-15之间的值。
    消息中的字段的编码值无需连续,只要是合法的,并且不能在同一个消息中有字段包含相同的编码值。
    建议:项目投入运营以后涉及到版本升级时的新增消息字段全部使用optional或者repeated,尽量不实用required。如果使用了required,需要全网统一升级,如果使用optional或者repeated可以平滑升级。

1 0
原创粉丝点击