BMP文件结构的探索(转载)-

来源:互联网 发布:老舍的人品 知乎 编辑:程序博客网 时间:2024/04/20 08:19

BMP文件结构的探索(转载)- -

                                      

 

一、文件格式

 

Bmp文件是非常常用的位图文件,无论是游戏还是其他都被广泛使用。针对bmp文件的处理也有一堆现成的api进行调用,然而文件内部究竟怎样,如何自己来解析这样的文件呢?为了消除无聊,我用了几天时间来研究了一下,同时作为学习笔记,进行记录。

 

首先,整个bmp文件的内容可以分为3到4块。之所以分为3到4块而不是固定的值,是因为,对于bmp来说可能存在调色板或者一些掩码。具体稍候讨论。

 

第一块是bmp的文件头用于描述整个bmp文件的情况。结构如下:

 

typedef struct tagBITMAPFILEHEADER { 

 

  WORD    bfType;    

 

  DWORD   bfSize; 

 

  WORD    bfReserved1; 

 

  WORD    bfReserved2; 

 

  DWORD   bfOffBits; 

 

} BITMAPFILEHEADER, *PBITMAPFILEHEADER;

 

这些信息相当有用,如果你想直接来解析bmp文件。第一个bfType用于表示文件类型,如果它是bmp文件,那么它这个位置的值一定是”BM” 也就是0x4D42。第二个bfSize表示整个文件的字节数。第三第四个 则保留,目前无意义,最后一个相当重要,表示,位图的数据信息离文件头的偏移量,以字节为单位。

 

第二块是位图信息头,即BITMAPINFOHEADER,用于描述整个位图文件的情况。以下挑重要的数据进行解释

 

typedef struct tagBITMAPINFOHEADER{

 

  DWORD  biSize; //表示本结构的大小

 

  LONG   biWidth; //位图的宽度

 

  LONG   biHeight; //位图的高度

 

WORD   biPlanes; //永远为1 ,由于没有用过所以 没做研究 附msdn解释

 

//Specifies the number of planes for the target device. This value must be set to 1.

 

  WORD   biBitCount;//位图的位数  分为1 4 8 16 24 32 本文没对1 4 进行研究

 

  DWORD  biCompression; //本以为压缩类型,但是却另外有作用,稍候解释

 

  DWORD  biSizeImage; //表示位图数据区域的大小以字节为单位

 

  LONG   biXPelsPerMeter;

 

  LONG   biYPelsPerMeter;

 

  DWORD  biClrUsed;

 

  DWORD  biClrImportant;

 

} BITMAPINFOHEADER, *PBITMAPINFOHEADER;

 

     第三块就是调色板信息或者掩码部分,如果是8位位图则存放调色板 ;16 与32位 位图则存放RGB颜色的掩码,这些掩码以DWORD大小来存放。

 

     最后一块就是位图的数据实体。

 

     以上文件信息可以在任意一篇bmp文件结构的文章中找到描述,所以本文只是稍微带过。


二、4字节对其问题

 

     关于数据读取。Bmp文件有个重要特性,那就是对于数据区域而言,每行的数据它必须凑满4字节,如果没有满,则用冗余的数据来补齐。这个特性直接影响到我们读取位图数据的方法,因为在我们看来(x,y)的数据应该在 y*width+x这样的位置上 但是因为会有冗余信息 那么必须将width用width+该行的冗余量来处理,而由于位图文件有不同的位数,所以这样的计算也不尽相同。

 

     下面列出计算偏移量的一般公式。

 

     首先将位图信息读入一个UCHAR 的buffer中 :

 

     8位:

 

int pitch;

 

        if(width%4==0){

 

           pitch=width;

 

        }else{

 

           pitch=width+4-width%4;

 

       }

 

        index=buffer[y*pitch+x]; 因为8位位图的数据区域存放的是调色板索引值,所以只需读取这个index

 

    16位

 

       int pitch=width+width%2;

 

        buffer[(y*pitch+x)*2]

 

buffer[(i*pitch+j)*2+1]

 

两个UCHAR内,存放的是(x,y)处的颜色信息

 

   24位

 

       int pitch=width%4;

 

        buffer[(y*width+x)*3+y*pitch];

 

        buffer[(y*width+x)*3+y*pitch+1];

 

buffer[(y*width+x)*3+y*pitch+2];

 

   32位

 

       由于一个象素就是4字节 所以无需补齐

 

 

 

     虽然计算比较繁琐,但是这些计算是必须的,否则当你的位图每行的象素数不是4的倍数,那么y*width+x带给你的是一个扭曲的图片,当然如果你想做这样的旋转,也不错啊,至少我因为一开始没有考虑(不知道这个特性)让一个每行象素少1字节的16位图片变成了扭曲的菱形。

 

 

 

三、有了数据分离RGB分量。

 

     由于我的测试代码用了GDI,所以我必须讲得到的某一个点的值分离成 24位模式下的RGB分离,这不是一件容易的工作。位图麻烦的地方之一就是他的格式太多,所以我们还是要分格式再讨论。

 

     8位

 

     通过第二部分提到的操作我们得到了一个index,这个值的范围是0~255 一共256个 正好是调色板的颜色数量。

 

     在8位bmp图片中 数据信息前256个RGBQUAD的大小开始就是调色板的信息。不过如果要组织成调色板还要一定的转换因为里面是RGBQUAD信息 r b 两个与调色板中的顺序是颠倒的。因为我不需要调色板设置所以我字节读取到RGBQUAD数组中,并且通过下面的表达式获取RGB值:

 

UCHAR r=quad[index].rgbRed;

 

           UCHAR g=quad[index].rgbGreen;

 

           UCHAR b=quad[index].rgbBlue;

 

16位

 

这是最麻烦的一个。因为在处理时有555 565 两种格式的区别,而且还有所谓压缩类型的区别。

 

之前的bitmapinfoheader里面提到一个biCompression

 

现在我们分两种情况讨论:BI_RGB和BI_BITFIELDS

 

当他等于BI_RGB时 只有555 这种格式,所以可以放心大胆的进行如下的数据分离:

 

UCHAR b=buffer[(i*pitch+j)*2]&0x1F;

 

UCHAR g=(((buffer[(i*pitch+j)*2+1]<<6)&0xFF)>>3)+(buffer[(i*pitch+j)*2]>>5);

 

UCHAR r=(buffer[(i*pitch+j)*2+1]<<1)>>3;

 

 

 

希望不要被这个表达式折磨的眼花缭乱,我想既然你在看这篇文章,你就有能力阅读这样的代码,否则只能说你还没有到阅读这方面的地步,需要去学习基础的语法了。

 

有一点值得提醒的是由于有较多的位操作 ,所以在处理的时候在前一次操作的上面加上一对括号,我就曾经因为没有加而导致出现误差,另外虽然buffer中一个元素代表的是一个UCHAR 但是右移操作会自动增长为两字节 所以需要在进行一次与操作截取低位的1字节数据。

 

现在讨论BI_BITFIELDS。

 

这个模式下 既可以有555 也可以有565 。

 

555 格式 xrrrrrgggggbbbbb

 

565 格式 rrrrrggggggbbbbb

 

显然不同的格式处理不同,所以我们要首先判断处到底属于那种格式。

 

Bitmapinfoheader的biCompression为BI_BITFIELDS时,在位图数据区域前存在一个RGB掩码的描述是3个DWORD值,我们只需要读取其中的R或者G的掩码,来判断是那种格式。

 

以红色掩码为例 0111110000000000的时候就是555格式 1111100000000000就是565格式。

 

以下是565格式时的数据分离:

 

UCHAR b=buffer[(i*pitch+j)*2]&0x1F;

 

UCHAR g=(((buffer[(i*pitch+j)*2+1]<<5)&0xFF)>>2)+(buffer[(i*pitch+j)*2]>>5);

 

UCHAR r=buffer[(i*pitch+j)*2+1]>>3;

 

 

 

现在我们得到了RGB各自的分量,但是还有一个新的问题,那就是由于两字节表示了3个颜色  555下每个颜色最多到0x1F 565格式下最大的绿色分量也就0x3F。所以我们需要一个转换 color=color*255/最大颜色数 即可

 

565下RGB(r*0xFF/0x1F,g*0xFF/0x3F,b*0xFF/0x1F)

 

24位

 

UCHAR b=buffer[(i*width+j)*3+realPitch];

 

UCHAR g=buffer[(i*width+j)*3+1+realPitch];

 

UCHAR r=buffer[(i*width+j)*3+2+realPitch];

 

    32位

 

UCHAR b=buffer[(i*width+j)*4];

 

    UCHAR g=buffer[(i*width+j)*4+1];

 

    UCHAR r=buffer[(i*width+j)*4+2];

 

 

 

四、剩余的问题

 

    当数据取到了,颜色也分离出来了 ,但是可能你绘出的位图是倒转的,这是因为有些位图的确是翻转的。通过bitmapinfoheader的biHeight可以判断是正常还是翻转,当biHeight>0的时候颠倒,它小于0的时候正常,不过测试写到现在看到的文件都是颠倒过来的。

原创粉丝点击