C语言各种数据类型在系统中占的字节和取值范围

来源:互联网 发布:升级下windows updata 编辑:程序博客网 时间:2024/03/29 09:54
 

    基本类型包括字节型(char)、整型(int)和浮点型(float/double)。
    定义基本类型变量时,可以使用符号属性signed、unsigned(对于char、int),和长度属性short、long(对于int、double)对变量的取值区间和精度进行说明。
    下面列举了Dev-C++下基本类型所占位数和取值范围:
符号属性    长度属性  基本型  所占位数    取值范围     输入符举例     输出符举例
--                        --         char                   -2^7 ~ 2^7-1      %c         %c、%d、%u
signed              --         char            8       -2^7 ~ 2^7-1         %c         %c、%d、%u
unsigned          --        char           8        0 ~ 2^8-1              %c         %c、%d、%u
[signed]       short        [int]         16       -2^15 ~ 2^15-1     %hd
unsigned     short       [int]         16      0 ~ 2^16-1              %hu、%ho、%hx
[signed]         --           int           32      -2^31 ~ 2^31-1       %d
unsigned      --           [int]        32      0 ~ 2^32-1               %u、%o、%x
[signed]        long     [int]         32      -2^31 ~ 2^31-1        %ld
unsigned     long     [int]          32     0 ~ 2^32-1                 %lu、%lo、%lx
[signed]       long    long         [int]     64     -2^63 ~ 2^63-1     %I64d
unsigned    long    long         [int]     64     0 ~ 2^64-1         %I64u、%I64o、%I64x
  --                 --        float         32     +/- 3.40282e+038      %f、%e、%g
  --                 --        double    64     +/- 1.79769e+308      %lf、%le、%lg %f、%e、%g
  --             long      double    96     +/- 1.79769e+308       %Lf、%Le、%Lg


几点说明:
    1. 注意! 表中的每一行,代表一种基本类型。“[]”代表可省略。
    例如:char、signed char、unsigned char是三种互不相同的类型;
int、short、long也是三种互不相同的类型。可以使用C++的函数重载特性进行验证,如:
    void Func(char ch) {}
    void Func(signed char ch) {}
    void Func(unsigned char ch) {}
是三个不同的函数。


   2. char/signed char/unsigned char型数据长度为1字节;
   char为有符号型,但与signed char是不同的类型。
注意! 并不是所有编译器都这样处理,char型数据长度不一定为1字节,char也不一定为有符号型。


    3. 将char/signed char转换为int时,会对最高符号位1进行扩展,从而造成运算问题。
    所以,如果要处理的数据中存在字节值大于127的情况,使用unsigned char较为妥当。程序中若涉及位运算,也应该使用unsigned型变量。


    4. char/signed char/unsigned char输出时,使用格式符%c(按字符方式);或使用%d、%u、%x/%X、%o,按整数方式输出;输入时,应使用%c,若使用整数方式,Dev-C++会给出警告,不建议这样使用。


    5. int的长度,是16位还是32位,与编译器字长有关。
    16位编译器(如TC使用的编译器)下,int为16位;32位编译器(如VC使用的编译器cl.exe)下,int为32
位。


    6. 整型数据可以使用%d(有符号10进制)、%o(无符号8进制)或%x/%X(无符号16进制)方式输入输出。而格式符%u,表示unsigned,即无符号10进制方式。


    7. 整型前缀h表示short,l表示long。
    输入输出short/unsigned short时,不建议直接使用int的格式符%d/%u等,要加前缀h。这个习惯性错误,来源于TC。TC下,int的长度和默认符号属性,都与short一致,于是就把这两种类型当成是相同的,都用int方式进行输入输出。


    8. 关于long long类型的输入输出:"%lld"和"%llu"是linux下gcc/g++用于long long int类型(64 bits)输入输出的格式符。而"%I64d"和"%I64u"则是Microsoft VC++库里用于输入输出__int64类型的格式说明。Dev-C++使用的编译器是Mingw32,Mingw32是x86-win32 gcc子项目之一,编译器核心还是linux下的gcc。进行函数参数类型检查的是在编译阶段,gcc编译器对格式字符串进行检查,显然它不认得"%I64d",所以将给出警“unknown conversion type character `I' in format”。对于"%lld"和"%llu",gcc理所当然地接受了。
    Mingw32在编译期间使用gcc的规则检查语法,在连接和运行时使用的却是Microsoft库。这个库里的printf和scanf函数当然不认识linux gcc下"%lld"和"%llu",但对"%I64d"和"%I64u",它则是乐意接受,并能正常工作的。


    9. 浮点型数据输入时可使用%f、%e/%E或%g/%G,scanf会根据输入数据形式,自动处理。
    输出时可使用%f(普通方式)、%e/%E(指数方式)或%g/%G(自动选择)。


    10. 浮点参数压栈的规则:float(4 字节)类型扩展成double(8 字节)入栈。所以在输入时,需要区分float(%f)与double(%lf),而在输出时,用%f即可。printf函数将按照double型的规则对压入堆栈的float(已扩展成double)和double型数据进行输出。如果在输出时指定%lf格式符,gcc/mingw32编译器将给出一个警告。

    11. Dev-C++(gcc/mingw32)可以选择float的长度,是否与double一致。


    12. 前缀L表示long(double)。
    虽然long double比double长4个字节,但是表示的数值范围却是一样的。long double类型的长度、精度及表示范围与所使用的编译器、操作系统等有关。

 

 

  最近在做一个项目的过程中,遇到了协议的加密解密和封装,其中经常遇到unsigned类型的数据和普通数据类型间转来转去,所以经过研究,简单封装了几个函数,在这里分享给大家,有不足之处还望大家给予指正。

unsigned short unCharToUnShort(unsigned char* pBuf)
{
 unsigned short result = 0;
 result = (short)pBuf[0]*256;
 result += (short)pBuf[1];
 return result;
}

unsigned int unCharToUnInt(unsigned char* pBuf)
{
 unsigned int result = 0;
 result = (short)pBuf[0]*256*256*256;
 result += (short)pBuf[1]*256*256;
 result += (short)pBuf[2]*256;
 result += (short)pBuf[3];
 return result;
}

  以上两个函数是把unsigned char*转换为unsigned short或unsigned int,数据的存放方式为高字节在前,低字节在后,比如无符号短整型256是0x01 0x00。我们通过依次获取低位的数据然后乘以0xFF,来获取低位所代表的整数值,然后再把各个位的值相加,得出最终需要的无符号整形值。其中把一个字节强转为short型,就是为了获取该字节的无符号整型值,因为一个short值占两个字符,我们这样强转,其实只用了short高位的那一个字节。

void unShortToUnChar(unsigned char* pBuf,unsigned short iValue)
{
 pBuf[0] = (unsigned char)(iValue>>8);
 pBuf[1] = (unsigned char)(iValue);
}

void unIntToUnChar(unsigned char* pBuf,unsigned int iValue)
{
 pBuf[0] = (unsigned char)(iValue>>24);
 pBuf[1] = (unsigned char)(iValue>>16);
 pBuf[2] = (unsigned char)(iValue>>8);
 pBuf[3] = (unsigned char)(iValue);
}

  以上两个函数作用是把无符号整形转换为unsigned char型。所使用的方式是把整型值右移8的倍数,然后取高位强转为unsigned char后赋值给我们的unsigned char数组中的各个字节。

  在做无符号数据类型和有符号数据类型转换的时候方式有很多,此处介绍的是我觉得比较简单且易懂的,代码已在VS和linux下测试通过。大家如果有更好的方式,欢迎跟帖交流,我好对本文章进行更新,方便其它同仁学习。

 

 

 

 

和机器字长及编译器有关系:所以,int,long int,short int的宽度都可能随编译器而异。

但有几条铁定的原则(ANSI/ISO制订的):

 1 sizeof(short int)<=sizeof(int)

2 sizeof(int)<=sizeof(long int)

3 short int至少应为16位(2字节)

4 long int至少应为32位。 unsigned 是无符号的意思。例如:

 

16位编译器

char :1个字节

char*(即指针变量): 2个字节

short int : 2个字节

int: 2个字节

unsigned int : 2个字节

float: 4个字节

double: 8个字节

long: 4个字节

long long: 8个字节

unsigned long: 4个字节

 

32位编译器

char :1个字节

char*(即指针变量): 4个字节(32位的寻址空间是2^32, 即32个bit,也就是4个字节。同理64位编译器)

short int : 2个字节

int: 4个字节

unsigned int : 4个字节

float: 4个字节

double: 8个字节

long: 4个字节

long long: 8个字节

unsigned long: 4个字节64位编译器

char :1个字节

char*(即指针变量): 8个字节

short int : 2个字节

int: 4个字节

unsigned int : 4个字节

float: 4个字节

double: 8个字节

long: 8个字节

long long: 8个字节

unsigned long: 8个字节

 

 

原创粉丝点击