接受导师的建议--自己做一个小的C项目---读取bmp格式图片(一)

来源:互联网 发布:ipad扩展屏幕windows 编辑:程序博客网 时间:2024/05/17 06:34

准备工作

bmp文件格式

如今Windows(3.x以及95,98,NT)系列已经成为绝大多数用户使用的操作系统,它比DOS成功的一个重要因素是它可视化的漂亮界面。那么Windows是如何显示图象的呢?这就要谈到位图(bitmap)


我们知道,普通的显示器屏幕是由许许多多点构成的,我们称之为象素。显示时采用扫描的方法:电子枪每次从左到右扫描一行,为每个象素着色,然后从上到下这样扫描若干行,就扫过了一屏。为了防止闪烁,每秒要重复上述过程几十次。例如我们常说的屏幕分辨率为640×480,刷新频率为70Hz,意思是说每行要扫描640个象素,一共有480行,每秒重复扫描屏幕70次。


我们称这种显示器为位映象设备。所谓位映象,就是指一个二维的象素矩阵,而位图就是采用位映象方法显示和存储的图象。

实例说明:

比如下面这张图片(左边(1)是jpeg格式,中间(2)是位图图片,右边(3)是位图图片信息):

(1)          (2)              (3)     


位图图片放大后就是这样(部分):



有图片明显看出彩色像素点的分布。

关于RGB三原色原理:

        自然界中的所有颜色都可以由红、绿、蓝(R,G,B)组合而成。有的颜色含有红色成分多一些,如深红;有的含有红色成分少一些,如浅红。针对含有红色成分的多少,可以分成0到255共256个等级,0级表示不含红色成分;255级表示含有100%的红色成分。同样,绿色和蓝色也被分成256级。这种分级概念称为量化。这样,根据红、绿、蓝各种不同的组合我们就能表示出256×256×256,约1600万种颜色。这么多颜色对于我们人眼来说已经足够丰富了。

常见颜色的RGB值:

颜色
R
G
B
255
0
0
0
0
255
绿
0
255
0
255
255
0
255
0
255
0
255
255
255
255
255
0
0
0
128
128
128

关于调色板:

你大概已经明白了,当一幅图中每个象素赋予不同的RGB值时,能呈现出五彩缤纷的颜色了,这样就形成了彩色图。的确是这样的,但实际上的做法还有些差别。

让我们来看看下面的例子。

有一个长宽各为200个象素,颜色数为16色的彩色图,每一个象素都用R、G、B三个分量表示。因为每个分量有256个级别,要用8位(bit),即一个字节(byte)来表示,所以每个象素需要用3个字节。整个图象要用200×200×3,约120k字节可不是一个小数目呀!如果我们用下面的方法,就能省的多。
因为是一个16色图,也就是说这幅图中最多只有16种颜色,我们可以用一个表:表中的每一行记录一种颜色的R、G、B值。这样当我们表示一个象素的颜色时,只需要指出该颜色是在第几行,即该颜色在表中的索引值。举个例子,如果表的第0行为255,0,0(红色),那么当某个象素为红色时,只需要标明0即可。
让我们再来计算一下:16种状态可以用4位(bit)表示,所以一个象素要用半个字节。整个图象要用200×200×0.5,约20k字节,再加上表占用的字节为3×16=48字节.整个占用的字节数约为前面的1/6,省很多吧?
这张R、G、B的表,就是我们常说的调色板(Palette),另一种叫法是颜色查找表LUT(Look Up Table),似乎更确切一些。Windows位图中便用到了调色板技术。其实不光是Windows位图,许多图象文件格式如pcx、tif、gif等都用到了。所以很好地掌握调色板的概念是十分有用的。

有一种图,它的颜色数高达256×256×256种,也就是说包含我们上述提到的R、G、B颜色表示方法中所有的颜色,这种图叫做真彩色图(true color)。真彩色图并不是说一幅图包含了所有的颜色,而是说它具有显示所有颜色的能力,即最多可以包含所有的颜色。表示真彩色图时,每个象素直接用R、G、B三个分量字节表示,而不采用调色板技术。原因很明显:如果用调色板,表示一个象素也要用24位,这是因为每种颜色的索引要用24位(因为总共有2种颜色,即调色板有2行),和直接用R,G,B三个分量表示用的字节数一样,不但没有任何便宜,还要加上一个256×256×256×3个字节的大调色板。所以真彩色图直接用R、G、B三个分量表示,它又叫做24位色图。


BMP结构详解(参考资料:http://www.vckbase.com/index.php/wv/1484.html)


BMP文件由文件头、位图信息头、颜色信息和图形数据四部分组成。

一、BMP文件头

BMP文件头数据结构含有BMP文件的类型、文件大小和位图起始位置等信息。其结构定义如下:

typedef struct tagBITMAPFILEHEADER{    WORD bfType;   // 位图文件的类型,必须为BM    DWORD   bfSize;   // 位图文件的大小,以字节为单位    WORD bfReserved1;  // 位图文件保留字,必须为0    WORD bfReserved2;  // 位图文件保留字,必须为0    DWORD   bfOffBits; // 位图数据的起始位置,以相对于位图文件头的偏移量表示,以字节为单位} BITMAPFILEHEADER; 

二、位图信息头

BMP位图信息头数据用于说明位图的尺寸等信息。其结构定义如下:

typedef struct tagBITMAPINFOHEADER{  DWORD  biSize;   // 本结构所占用字节数  LONG biWidth;  // 位图的宽度,以像素为单位  LONG biHeight; // 位图的高度,以像素为单位  WORD   biPlanes; // 目标设备的级别,必须为1  WORD   biBitCount// 每个像素所需的位数,必须是1(双色),4(16色),8(256色)或24(真彩色)之一  DWORD  biCompression;   // 位图压缩类型,必须是 0(不压缩),1(BI_RLE8压缩类型)或2(BI_RLE4压缩类型)之一  DWORD  biSizeImage; // 位图的大小,以字节为单位  LONG biXPelsPerMeter; // 位图水平分辨率,每米像素数  LONG biYPelsPerMeter;  // 位图垂直分辨率,每米像素数  DWORD  biClrUsed;// 位图实际使用的颜色表中的颜色数  DWORD  biClrImportant;// 位图显示过程中重要的颜色数} BITMAPINFOHEADER;  

三、颜色表和位图信息

颜色表用于说明位图中的颜色,有若干个表项,每一个表项是一个RGBQUAD类型的结构,定义一种颜色。RGBQUAD结构的定义如下:

typedef struct tagRGBQUAD {  BYTErgbBlue;// 蓝色的亮度(值范围为0-255)  BYTErgbGreen;   // 绿色的亮度(值范围为0-255)  BYTErgbRed; // 红色的亮度(值范围为0-255)  BYTErgbReserved;// 保留,必须为0} RGBQUAD; 
颜色表中RGBQUAD结构数据的个数有biBitCount来确定:    当biBitCount=1,4,8时,分别有2,16,256个表项;    当biBitCount=24时,没有颜色表项。

位图信息头和颜色表组成位图信息,BITMAPINFO结构定义如下:
typedef struct tagBITMAPINFO {  BITMAPINFOHEADER bmiHeader;   // 位图信息头  RGBQUAD  bmiColors[1];  // 颜色表} BITMAPINFO;
位图数据  
位图数据记录了位图的每一个像素值,记录顺序是在扫描行内是从左到右,扫描行之间是从下到上。位图的一个像素值所占的字节数: 
当biBitCount=1时,8个像素占1个字节;  当biBitCount=4时,2个像素占1个字节;  当biBitCount=8时,1个像素占1个字节;  当biBitCount=24时,1个像素占3个字节;  
Windows规定一个扫描行所占的字节数必须是4的倍数(即以long为单位),不足的以0填充, biSizeImage = ((((bi.biWidth * bi.biBitCount) + 31) & ~31) / 8) * bi.biHeight


四、数据读取和颜色分离

Bmp文件有个重要特性,那就是对于数据区域而言,每行的数据它必须凑满4字节,如果没有满,则用冗余的数据来补齐。这个特性直接影响到我们读取位图数据的方法,因为在我们看来(x,y)的数据应该在 y*width+x这样的位置上 但是因为会有冗余信息 那么必须将width用width+该行的冗余量来处理,而由于位图文件有不同的位数,所以这样的计算也不尽相同。

1位:
  for(int i=0; i<height; i++)    for(int j=0; j<width; j=j+8)    {      int k=7;      while(k>=0)      {        color[i][k+j]=buffer[n]%2;        buffer[n]=buffer[n]/2;        k--;      }    n++;    }

4位:
          int pitch;  if(width%8==0)    pitch=width;  else    pitch=width+8-width%8;    for(int i=0; i<height; i++)    for(int j=0; j<width; j++)  {    int index;    if(j%2==0)      index = buffer[(i*pitch+j)/2]/16;    if(j%2==1)      index = buffer[(i*pitch+j)/2]%16;    UCHAR r=quad[index].rgbRed;    UCHAR g=quad[index].rgbGreen;    UCHAR b=quad[index].rgbBlue;

8位:
int  pitch;if(width%4==0)  {    pitch=width;  }  else  {    pitch=width+4-width%4;  }  index=buffer[y*pitch+x]; //因为8位位图的数据区域存放的是调色板索引值,所以只需读取这个index
颜色分离:
 UCHAR r=quad[index].rgbRed;  UCHAR g=quad[index].rgbGreen;  UCHAR b=quad[index].rgbBlue;

16位: 
int pitch=width+width%2; buffer[(y*pitch+x)*2]  buffer[(y*pitch+x)*2+1]

两个UCHAR内,存放的是(x,y)处的颜色信息

颜色分离:

1.若bitmapinfoheader中的biCompression为BI_RGB时,为555格式,分离代码如下:   

UCHAR b=buffer[(i*pitch+j)*2]&0x1F;      UCHAR  g=(((buffer[(i*pitch+j)*2+1]<<6)&0xFF)>>3)+(buffer[(i*pitch+j)*2]>>5);      UCHAR r=(buffer[(i*pitch+j)*2+1]<<1)>>3;

2.若bitmapinfoheader中的biCompression为BI_BITFIELDS时,在位图数据区域前存在一个RGB掩码的描述 是3个DWORD值,我们只需要读取其中的R或者G的掩码,来判断是那种格式。 以红色掩码为例 0111110000000000的时候就是555格式1111100000000000就是565格式。 565格式分离代码如下:
      UCHAR  b=buffer[(i*pitch+j)*2]&0x1F;      UCHAR  g=(((buffer[(i*pitch+j)*2+1]<<5)&0xFF)>>2)+(buffer[(i*pitch+j)*2]>>5);      UCHAR  r=buffer[(i*pitch+j)*2+1]>>3;

24位:
  int pitch=width%4;  buffer[(y*width+x)*3+y*pitch];  buffer[(y*width+x)*3+y*pitch+1];  buffer[(y*width+x)*3+y*pitch+2];

颜色分离:
  UCHAR b=buffer[(i*width+j)*3+realPitch];  UCHAR g=buffer[(i*width+j)*3+1+realPitch];  UCHAR  r=buffer[(i*width+j)*3+2+realPitch];