关于计算机中无符号数,有符号数的注意事项

来源:互联网 发布:ubuntu怎么安装fcitx 编辑:程序博客网 时间:2024/05/16 12:10
简言之:计算机int用4byte 表示数据,其格式为用补码表示。
下面是知识背景及描述。
计算机是用补码表示数据的,正数的补码是其本身。负数的补码是其正数按位取反再加1. 模通常是32位。
注意。char *, 当其值大于80时,会扩展其符号位。char 类型数据有1byte 就够了,但有可能为其保留4byte 空间及寄存器使用4byte
形如:
0041141E  mov         eax,dword ptr [p]
00411421  movsx       ecx,byte ptr [eax]     // 符号位扩展
00411424  cmp         ecx,80h
0041142A  jle         test+45h (411445h)

而unsigned char * 其相应代码为:
0041141E  mov         eax,dword ptr [p]
00411421  movzx       ecx,byte ptr [eax] // 用0来填充
00411424  cmp         ecx,80h
0041142A  jle         test+45h (411445h)

例如:
void test( char *p)
{
    if((p[0]) > 0x80)  // 得不到正确结果,p[0] 符号位扩展成一个负数,而80仍然是32 bits ‘80’ 负数不可能大于正数
    {
        printf("it's a 汉字");
    }
}

void test( char *p)
{
    if((p[0]&0xff) > 0x80)    // 只比较最后一个byte, 正确
    {
        printf("it's a 汉字");
    }
}
void test( unsigned char *p)
{
    if((p[0]) > 0x80)    // 按无符号数比较,正确
    {
        printf("it's a 汉字");
    }
}
原创粉丝点击