H264的I/P/B帧类型判断

来源：互联网发布：tcl网络电视u盘网卡编辑：程序博客网时间：2024/05/21 15:26

转自：http://blog.csdn.net/zhuweigangzwg/article/details/44152239

这里首先说明下H264的结构：

00 00 00 01/00 00 01->nal(1bytes)->slice->宏块->运动估计向量。

如果h264的body中出现了前缀则由00 00 00 01/00 00 01变为00 03 00 00 01/00 03 00 01.

我们看到常用naltype 像sps= 0x07 pps= 0x08 sei = 0x06 I/P/B= 0x01/0x05 也就是说只判断naltype = 0x01/0x05是判断不出来I/P/B帧类型的，需要到slice层去判断用到“熵编码”具体的“熵编码”内容请看：“H.264官方中文版.pdf”.

下面是扣的ffmpeg的源码判断I/P/B帧类型的实现:

int GetFrameType(NALU_t * nal){bs_t s;int frame_type = 0; unsigned char * OneFrameBuf_H264 = NULL ;if ((OneFrameBuf_H264 = (unsigned char *)calloc(nal->len + 4,sizeof(unsigned char))) == NULL){printf("Error malloc OneFrameBuf_H264\n");return getchar();}if (nal->startcodeprefix_len == 3){OneFrameBuf_H264[0] = 0x00;OneFrameBuf_H264[1] = 0x00;OneFrameBuf_H264[2] = 0x01;memcpy(OneFrameBuf_H264 + 3,nal->buf,nal->len);}else if (nal->startcodeprefix_len == 4){OneFrameBuf_H264[0] = 0x00;OneFrameBuf_H264[1] = 0x00;OneFrameBuf_H264[2] = 0x00;OneFrameBuf_H264[3] = 0x01;memcpy(OneFrameBuf_H264 + 4,nal->buf,nal->len);}else{printf("H264读取错误！\n");}bs_init( &s,OneFrameBuf_H264 + nal->startcodeprefix_len + 1  ,nal->len - 1 );if (nal->nal_unit_type == NAL_SLICE || nal->nal_unit_type ==  NAL_SLICE_IDR ){/* i_first_mb */bs_read_ue( &s );/* picture type */frame_type =  bs_read_ue( &s );switch(frame_type){case 0: case 5: /* P */nal->Frametype = FRAME_P;break;case 1: case 6: /* B */nal->Frametype = FRAME_B;break;case 3: case 8: /* SP */nal->Frametype = FRAME_P;break;case 2: case 7: /* I */nal->Frametype = FRAME_I;I_Frame_Num ++;break;case 4: case 9: /* SI */nal->Frametype = FRAME_I;break;}}else if (nal->nal_unit_type == NAL_SEI){nal->Frametype = NAL_SEI;}else if(nal->nal_unit_type == NAL_SPS){nal->Frametype = NAL_SPS;}else if(nal->nal_unit_type == NAL_PPS){nal->Frametype = NAL_PPS;}if (OneFrameBuf_H264){free(OneFrameBuf_H264);OneFrameBuf_H264 = NULL;}return 1;}

//H264一帧数据的结构体typedef struct Tag_NALU_t{unsigned char forbidden_bit;           //! Should always be FALSEunsigned char nal_reference_idc;       //! NALU_PRIORITY_xxxxunsigned char nal_unit_type;           //! NALU_TYPE_xxxx  unsigned int  startcodeprefix_len;      //! 前缀字节数unsigned int  len;                     //! 包含nal 头的nal 长度，从第一个00000001到下一个000000001的长度unsigned int  max_size;                //! 最多一个nal 的长度unsigned char * buf;                   //! 包含nal 头的nal 数据unsigned char Frametype;               //! 帧类型unsigned int  lost_packets;            //! 预留} NALU_t;//nal类型enum nal_unit_type_e{NAL_UNKNOWN     = 0,NAL_SLICE       = 1,NAL_SLICE_DPA   = 2,NAL_SLICE_DPB   = 3,NAL_SLICE_DPC   = 4,NAL_SLICE_IDR   = 5,    /* ref_idc != 0 */NAL_SEI         = 6,    /* ref_idc == 0 */NAL_SPS         = 7,NAL_PPS         = 8/* ref_idc == 0 for 6,9,10,11,12 */};//帧类型enum Frametype_e{FRAME_I  = 15,FRAME_P  = 16,FRAME_B  = 17};

//Mybs.h#pragma once#include "Information.h"//读取字节结构体typedef struct Tag_bs_t{unsigned char *p_start;               //缓冲区首地址(这个开始是最低地址)unsigned char *p;           //缓冲区当前的读写指针 当前字节的地址，这个会不断的++，每次++，进入一个新的字节unsigned char *p_end;           //缓冲区尾地址//typedef unsigned char   uint8_t;int     i_left;           // p所指字节当前还有多少 “位” 可读写 count number of available(可用的)位 }bs_t;/*函数名称：函数功能：初始化结构体参    数：返 回 值：无返回值,void类型思    路：资    料：  */void bs_init( bs_t *s, void *p_data, int i_data );/*该函数的作用是：从s中读出i_count位，并将其做为uint32_t类型返回思路:若i_count>0且s流并未结束，则开始或继续读取码流；若s当前字节中剩余位数大于等于要读取的位数i_count，则直接读取；若s当前字节中剩余位数小于要读取的位数i_count，则读取剩余位，进入s下一字节继续读取。补充:写入s时，i_left表示s当前字节还没被写入的位，若一个新的字节，则i_left=8；读取s时，i_left表示s当前字节还没被读取的位，若一个新的字节，则i_left＝8。注意两者的区别和联系。00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 0000000-------- -----000 00000000 ...写入s时：i_left = 3读取s时：i_left = 5我思：字节流提前放在了结构体bs_s的对象bs_t里了，可能字节流不会一次性读取/分析完，而是根据需要，每次都读取几比特bs_s里，有专门的字段用来记录历史读取的结果,每次读取，都会在上次的读取位置上进行比如，100字节的流，经过若干次读取，当前位置处于中间一个字节处，前3个比特已经读取过了，此次要读取2比特00001001000 01 001 (已读过的 本次要读的 以后要读的 )i_count = 2(计划去读2比特)i_left  = 5(还有5比特未读，在本字节中)i_shr = s->i_left - i_count = 5 - 2 = 3*s->p >> i_shr，就把本次要读的比特移到了字节最右边(未读，但本次不需要的给移到了字节外，抛掉了)00000001i_mask[i_count] 即i_mask[2] 即0x03:00000011( *s->p >> i_shr )&i_mask[i_count]; 即00000001 & 00000011 也就是00000001 按位与 00000011结果是：00000001i_result |= ( *s->p >> i_shr )&i_mask[i_count];即i_result |=00000001 也就是 i_result =i_result | 00000001 = 00000000 00000000 00000000 00000000 | 00000001 =00000000 00000000 00000000 00000001i_result =return( i_result ); 返回的i_result是4字节长度的，是unsigned类型 sizeof(unsigned)=4*/int bs_read( bs_t *s, int i_count );/*函数名称：函数功能：从s中读出1位，并将其做为uint32_t类型返回。函数参数：返 回 值：思    路：若s流并未结束，则读取一位资    料：毕厚杰：第145页，u(n)/u(v)，读进连续的若干比特，并将它们解释为“无符号整数”return i_result;//unsigned int*/int bs_read1( bs_t *s );/*函数名称：函数功能：从s中解码并读出一个语法元素值参    数：返 回 值：思    路：从s的当前位读取并计数，直至读取到1为止；while( bs_read1( s ) == 0 && s->p < s->p_end && i < 32 )这个循环用i记录了s当前位置到1为止的0的个数，并丢弃读到的第一个1；返回2^i-1+bs_read(s,i)。例：当s字节中存放的是0001010时，1前有3个0，所以i＝3；返回的是：2^i-1+bs_read(s,i)即：8－1＋010＝9资    料：毕厚杰：第145页，ue(v)；无符号指数Golomb熵编码x264中bs.h文件部分函数解读 http://wmnmtm.blog.163.com/blog/static/382457142011724101824726/无符号整数指数哥伦布码编码 http://wmnmtm.blog.163.com/blog/static/38245714201172623027946/*/int bs_read_ue( bs_t *s );

//Mybs.cpp#include "Mybs.h"void bs_init( bs_t *s, void *p_data, int i_data ){s->p_start = (unsigned char *)p_data;//用传入的p_data首地址初始化p_start，只记下有效数据的首地址s->p       = (unsigned char *)p_data;//字节首地址，一开始用p_data初始化，每读完一个整字节，就移动到下一字节首地址s->p_end   = s->p + i_data;                //尾地址，最后一个字节的首地址?s->i_left  = 8;                //还没有开始读写，当前字节剩余未读取的位是8}int bs_read( bs_t *s, int i_count ){ static int i_mask[33] ={0x00,                                  0x01,      0x03,      0x07,      0x0f,                                  0x1f,      0x3f,      0x7f,      0xff,                                  0x1ff,     0x3ff,     0x7ff,     0xfff,                                  0x1fff,    0x3fff,    0x7fff,    0xffff,                                  0x1ffff,   0x3ffff,   0x7ffff,   0xfffff,                                  0x1fffff,  0x3fffff,  0x7fffff,  0xffffff,                                  0x1ffffff, 0x3ffffff, 0x7ffffff, 0xfffffff,                                  0x1fffffff,0x3fffffff,0x7fffffff,0xffffffff};/*  数组中的元素用二进制表示如下：  假设：初始为0，已写入为+，已读取为-    字节:1234   00000000 00000000 00000000 00000000下标  0x00:  00000000x[0]  0x01:  00000001x[1]  0x03:  00000011x[2]  0x07:  00000111x[3]  0x0f:  00001111x[4]  0x1f:  00011111x[5]  0x3f:  00111111x[6]  0x7f:  01111111x[7]  0xff:  11111111x[8]1字节 0x1ff: 0001 11111111x[9] 0x3ff: 0011 11111111x[10]i_mask[s->i_left] 0x7ff: 0111 11111111x[11] 0xfff: 1111 11111111x[12]1.5字节0x1fff: 00011111 11111111x[13]0x3fff: 00111111 11111111x[14]0x7fff: 01111111 11111111x[15]0xffff: 11111111 11111111x[16]2字节   0x1ffff:0001 11111111 11111111x[17]   0x3ffff:0011 11111111 11111111x[18]   0x7ffff:0111 11111111 11111111x[19]   0xfffff:1111 11111111 11111111x[20]2.5字节  0x1fffff:00011111 11111111 11111111x[21]  0x3fffff:00111111 11111111 11111111x[22]  0x7fffff:01111111 11111111 11111111x[23]  0xffffff:11111111 11111111 11111111x[24]3字节 0x1ffffff:   0001 11111111 11111111 11111111x[25] 0x3ffffff:   0011 11111111 11111111 11111111x[26] 0x7ffffff:    0111 11111111 11111111 11111111x[27] 0xfffffff:    1111 11111111 11111111 11111111x[28]3.5字节0x1fffffff:00011111 11111111 11111111 11111111x[29]0x3fffffff:00111111 11111111 11111111 11111111x[30]0x7fffffff:01111111 11111111 11111111 11111111x[31]0xffffffff:11111111 11111111 11111111 11111111x[32]4字节 */    int      i_shr;    //    int i_result = 0;        //用来存放读取到的的结果 typedef unsigned   uint32_t;    while( i_count > 0 )    //要读取的比特数    {        if( s->p >= s->p_end )//字节流的当前位置>=流结尾，即代表此比特流s已经读完了。        {//            break;        }        if( ( i_shr = s->i_left - i_count ) >= 0 )//当前字节剩余的未读位数，比要读取的位数多，或者相等        {//i_left当前字节剩余的未读位数，本次要读i_count比特，i_shr=i_left-i_count的结果如果>=0，说明要读取的都在当前字节内//i_shr>=0，说明要读取的比特都处于当前字节内//这个阶段，一次性就读完了，然后返回i_result(退出了函数)            /* more in the buffer than requested */            i_result |= ( *s->p >> i_shr )&i_mask[i_count];//“|=”:按位或赋值，A |= B 即 A = A|B//|=应该在最后执行，把结果放在i_result(按位与优先级高于复合操作符|=)//i_mask[i_count]最右侧各位都是1,与括号中的按位与，可以把括号中的结果复制过来//!=,左边的i_result在这儿全是0，右侧与它按位或，还是复制结果过来了，好象好几步都多余/*读取后，更新结构体里的字段值*/            s->i_left -= i_count; //即i_left = i_left - i_count，当前字节剩余的未读位数，原来的减去这次读取的            if( s->i_left == 0 )//如果当前字节剩余的未读位数正好是0，说明当前字节读完了，就要开始下一个字节            {                s->p++;//移动指针，所以p好象是以字节为步长移动指针的                s->i_left = 8;//新开始的这个字节来说，当前字节剩余的未读位数，就是8比特了            }            return( i_result );//可能的返回值之一为：00000000 00000000 00000000 00000001 (4字节长)        }        else/* i_shr < 0 ,跨字节的情况*/        {//这个阶段，是while的一次循环，可能还会进入下一次循环，第一次和最后一次都可能读取的非整字节，比如第一次读了3比特，中间读取了2字节(即2x8比特)，最后一次读取了1比特，然后退出while循环//当前字节剩余的未读位数，比要读取的位数少，比如当前字节有3位未读过，而本次要读7位//???对当前字节来说，要读的比特，都在最右边，所以不再移位了(移位的目的是把要读的比特放在当前字节最右)            /* less(较少的) in the buffer than requested */i_result |= (*s->p&i_mask[s->i_left]) << -i_shr;//"-i_shr"相当于取了绝对值//|= 和 << 都是位操作符，优先级相同，所以从左往右顺序执行//举例:int|char ，其中int是4字节，char是1字节，sizeof(int|char)是4字节//i_left最大是8，最小是0，取值范围是[0,8]i_count  -= s->i_left;//待读取的比特数，等于原i_count减去i_left，i_left是当前字节未读过的比特数，而此else阶段，i_left代表的当前字节未读的比特全被读过了，所以减它s->p++;//定位到下一个新的字节s->i_left = 8;//对一个新字节来说，未读过的位数当然是8，即本字节所有位都没读取过        }    }    return( i_result );//可能的返回值之一为：00000000 00000000 00000000 00000001 (4字节长)}int bs_read1( bs_t *s ){if( s->p < s->p_end ){unsigned int i_result;s->i_left--;                           //当前字节未读取的位数少了1位i_result = ( *s->p >> s->i_left )&0x01;//把要读的比特移到当前字节最右，然后与0x01:00000001进行逻辑与操作，因为要读的只是一个比特，这个比特不是0就是1，与0000 0001按位与就可以得知此情况if( s->i_left == 0 )                   //如果当前字节剩余未读位数是0，即是说当前字节全读过了{s->p++;                   //指针s->p 移到下一字节s->i_left = 8;                     //新字节中，未读位数当然是8位}return i_result;                       //unsigned int}return 0;                                  //返回0应该是没有读到东西}int bs_read_ue( bs_t *s ){int i = 0;while( bs_read1( s ) == 0 && s->p < s->p_end && i < 32 )//条件为：读到的当前比特=0，指针未越界，最多只能读32比特{i++;}return( ( 1 << i) - 1 + bs_read( s, i ) );}

0 0