FLV文件格式解析

来源:互联网 发布:玩洋妞什么感觉知乎 编辑:程序博客网 时间:2024/04/29 09:11

1.        FLV文件对齐方式

FLV文件以大端对齐方式存放多字节整型。

如存放数字无符号16位的数字300(0x012C),那么在FLV文件中存放的顺序是:|0x01|0x2C|。

如果是无符号32位数字300(0x0000012C),那么在FLV文件中的存放顺序是:|0x00|0x00|0x00|0x01|0x2C。

2.        FLV文件格式

FLV文件格式比较简单,分为Header和Body两部分。

即:|FLV_Header(9)|FLV_Body(n)|,括号里是长度,以byte为单位。

以下分别介绍Header和Body的具体内容格式。

3.        FLV Header格式

FLV Body的内容长度是固定的,格式如下:

| F(8) | L(8) | V(8) | Version(8) | TypeFlagsReserved(5) | TypeFlagsAudio(1)| TypeFlagsReserved(1) | TypeFlagsVideo(1) | DataOffset(32) |.

可知FLV Header头部的长度为9 bytes。

前三个字节为FLV,十六进制表示为 0x46 0x4C 0x56。

Version为FLV的版本号,一般为0x01。

TypeFlagsReserved为保留位,均为0

TypeFlagsAudio为FLV文件中是否包括音频数据,1是有,0是没有。

TypeFlagsVideo为FLV文件中是否包括视频数据,1是有,0是没有。

DataOffset为FLV Header的长度,为固定值0x00000009。

4.        FLV Body格式

FLV Body的内容为多个Tag和Tag的长度组成。

即:

| PreviousTagSize0(32) | Tag1(PreviousTagSize1) |PreviousTagSize1(32) | Tag2 | ……| PreviousTagSizeN-1(32) | TagN(previousTagSizeN)| previousTagSizeN(32) |

PreviousTagSize0为0x00000000。

Tag为每一个内容,目前包括音频、视频、脚本。

previousTagSize为前一个Tag的长度。

5.        FLV Tag格式

FLV Tag是FLV Body的内容,具体Tag同样是由Tag Header和Tag Data组成。

即FLV Tag Format :

| TagType(8) | DataSize(24) | Timestamp(24) |TimestampExtended(8) | StreamID(24) | Data(DataSize) |

TagType为Tag的类型:

目前支持的类型:

音频为0x08;

视频为0x09;

脚本数据为0x12。

DataSize为Data的长度。

Timestamp为相对第一个Tag的时间戳,因此第一个Tag的时间戳为0。也可以将所有Tag的时间戳全配置为0,解码器会自动处理。

StreamID为默认的全为0。

Data为具体的数据内容,

如果TagType=0x08,为AudioData;

如果TagType=0x09,为VideoData;

如果TagType=0x12,为ScriptDataObject,但该项因为内容不固定,所以在FLV文件中可以没有该Tag内容。

6.        VideoData格式

VideoData的内容,同样包括VideoData Header和VideoData Body。

即VideoData Format:

Video Header = | FrameType(4) | CodecID(4) |

VideoData = | FrameType(4) | CodecID(4) | VideoData(n) |

FrameType为数据类型,1为关键帧,2为非关键帧,3为h263的非关键帧,4为服务器生成关键帧,5为视频信息或命令帧。

CodecID为包装类型,1为JPEG,2为H263,3为Screen video,4为On2 VP6,5为On2 VP6,6为Screen videoversion 2,7为AVC。

VideoData为数据具体内容:

如果CodecID=2,为H263VideoPacket;

如果CodecID=3,为ScreenVideopacket;

如果CodecID=4,为VP6FLVVideoPacket;

如果CodecID=5,为VP6FLVAlphaVideoPacket;

如果CodecID=6,为ScreenV2VideoPacket;

如果CodecID=7,为AVCVideoPacket;

7.        AVCVideoPacket格式

AVCVideoPacket同样包括Packet Header和Packet Body两部分:

即AVCVideoPacket Format:

| AVCPacketType(8)| CompostionTime(24) | Data |

AVCPacketType为包的类型:

         如果AVCPacketType=0x00,为AVCSequence Header;

         如果AVCPacketType=0x01,为AVC NALU;

         如果AVCPacketType=0x02,为AVC end ofsequence

CompositionTime为相对时间戳:

         如果AVCPacketType=0x01, 为相对时间戳;

         其它,均为0;

Data为负载数据:

         如果AVCPacketType=0x00,为AVCDecorderConfigurationRecord;

         如果AVCPacketType=0x01,为NALUs;

         如果AVCPacketType=0x02,为空。

8.        AVCDecorderConfigurationRecord格式

AVCDecorderConfigurationRecord包括文件的信息。

具体格式如下:

| cfgVersion(8) | avcProfile(8) | profileCompatibility(8) |avcLevel(8) | reserved(6) | lengthSizeMinusOne(2) | reserved(3) | numOfSPS(5) |spsLength(16) | sps(n) | numOfPPS(8) | ppsLength(16) | pps(n) |

 

实例:

总体上看,FLV包括文件头(File Header)和文件体(File Body)两部分,其中文件体由一系列的Tag及Tag Size对组成。因此一个FLV文件看上去是下面的结构:

FLV文件格式解析

    其中,Previous Tag Size紧跟在每个Tag之后,占4个字节表示一个UI32类型的数值,表示前面一个Tag的大小。需要注意的是,Previous Tag Size #0的值总是为0。Tag类型包括视频、音频和Script,且每个Tag只能包含一种类型的数据。下面我们看看File Header和Tag的具体结构,为了方便大家理解,我贴一个实际FLV文件的字节流图片,图片中把不同部分区分了颜色。

FLV文件格式解析

 

一、File Header结构

    File Header在当前版本中总是由9个字节组成,如图中蓝色区域所示。

    第1-3字节为文件标识(Signature),总为“FLV”(0x46 0x4C 0x56),如图中紫色区域。

    第4字节为版本,目前为1(0x01)。

    第5个字节的前5位保留,必须为0。

    第5个字节的第6位表示是否存在音频Tag。

    第5个字节的第7位保留,必须为0。

    第5个字节的第8位表示是否存在视频Tag。

    第6-9个字节为UI32类型的值,表示从File Header开始到File Body开始的字节数,版本1中总为9。

 

二、Previous Tag Size结构

    如图中红色位置所示。

 

三、Tag结构

    Tag包括Tag Header和Tag Data两部分。不同类型的Tag的Header结构是相同的,但是Data结构各不相同。如图中绿色和黄色区域分别表示Tag Header数据和Tag Data数据。

    当前版本的Tag Header结构占用11个字节。

    第1个字节表示Tag类型,包括音频(0x08)、视频(0x09)和script data(0x12),其他类型值被保留。

    第2-4字节为UI24类型的值,表示该Tag Data部分的大小。

    第5-7字节为UI24类型的值,表示该Tag的时间戳(单位为ms),第一个Tag的时间戳总是0。

    第8个字节为时间戳的扩展字节,当24位数值不够时,该字节作为最高位将时间戳扩展为32位值。

    第9-11字节为UI24类型的值,表示stream id,总是0。

    后面的字节为Tag Data数据,Data的大小由第2-4字节的数值指示,根据第1个字节指示的Tag类型,按照不同的结构解析Tag Data。下面分别介绍。

 

四、Audio Tag Data结构

    音频Tag开始的第1个字节包含了音频数据的参数信息,从第2个字节开始为音频流数据。

    第1个字节的前4位的数值表示了音频数据格式,各值代表的意义大家可以查阅Adobe公司发布的FLV格式说明文档(可以到我的磁盘空间的“资料”目录去下载http://e.ys168.com/?tinyfun)。

    第1个字节的第5-6位的数值表示采样率,0 = 5.5 kHz,1 = 11 kHz,2 = 22 kHz,3 = 44 kHz。

    第1个字节的第7位表示采样精度,0 = 8bits,1 = 16bits。

    第1个字节的第8位表示音频类型,0 = mono,1 = stereo。

 

五、Video Tag Data结构

    视频Tag也用开始的第1个字节包含视频数据的参数信息,从第2个字节开始为视频流数据。

    第1个字节的前4位的数值表示帧类型。

    第1个字节的后4位的数值表示视频编码ID,1 = JPEG(现已不用),2 = Sorenson H.263,3 = Screen video,4 = On2 VP6,5 = On2 VP6 with alpha channel,6 = Screen video version 2。

 

六、Script Tag Data结构

    该类型Tag又通常被称为Metadata Tag,会放一些关于FLV视频和音频的参数信息,如duration、width、height等。通常该类型Tag会跟在File Header后面作为第一个Tag出现,而且只有一个。

    一般来说,该Tag Data结构包含两个AMF包。AMF(Action Message Format)是Adobe设计的一种通用数据封装格式,在Adobe的很多产品中应用,简单来说,AMF将不同类型的数据用统一的格式来描述。第一个AMF包封装字符串类型数据,用来装入一个“onMetaData”标志,这个标志与Adobe的一些API调用有,在此不细述。第二个AMF包封装一个数组类型,这个数组中包含了音视频信息项的名称和值。具体说明如下,大家可以参照图片上的数据进行理解。

 

    第一个AMF包:

       第1个字节表示AMF包类型,一般总是0x02,表示字符串,其他值表示意义请查阅文档。

       第2-3个字节为UI16类型值,表示字符串的长度,一般总是0x000A(“onMetaData”长度)。

       后面字节为字符串数据,一般总为“onMetaData”。

 

    第二个AMF包:

       第1个字节表示AMF包类型,一般总是0x08,表示数组。

       第2-5个字节为UI32类型值,表示数组元素的个数。

       后面即为各数组元素的封装,数组元素为元素名称和值组成的对。表示方法如下:

       第1-2个字节表示元素名称的长度,假设为L。

       后面跟着为长度为L的字符串。

       第L+3个字节表示元素值的类型。

       后面跟着为对应值,占用字节数取决于值的类型。

 

    OK,到此FLV文件结构讲完了,希望我已经讲清楚了:)另外我自己写了一个小工具,用它可以查看一个FLV文件的结构,并且能够分析各个字段对应字节的具体值,截图如下。目前还有一些小问题需要完善,后面我会加一个使用说明。想用的朋友可以到我磁盘空间的“工具”目录去下载。(http://tinyfun.ys168.com/)

FLV文件格式解析

 

 

原创粉丝点击