理解有符号数和无符号数

来源:互联网 发布:linux常用命令手册pdf 编辑:程序博客网 时间:2024/06/05 04:30

1、你自已决定是否需要有正负。 

就像我们必须决定某个量使用整数还是实数,使用多大的范围数一样,我们必须自已决定某个量是否需要正负。如果这个量不会有负值,那么我们可以定它为带正负的类型。 

在计算机中,可以区分正负的类型,称为有符类型(signed),无正负的类型(只有正值),称为无符类型。 (unsigned)数值类型分为整型或实型,其中整型又分为无符类型或有符类型,而实型则只有符类型。 字符类型也分为有符和无符类型。 比如有两个量,年龄和库存,我们可以定前者为无符的字符类型,后者定为有符的整数类型。 

2、使用二制数中的最高位表示正负。 

首先得知道最高位是哪一位?1个字节的类型,如字符类型,最高位是第7位,2个字节的数,最高位是第15位,4个字节的数,最高位是第31位。不同长度的数值类型,其最高位也就不同,但总是最左边的那位(如下示意)。字符类型固定是1个字节,所以最高位总是第7位。 

(红色为最高位) 

单字节数: 11111111 

双字节数: 11111111 11111111 

四字节数: 11111111 11111111 11111111 11111111 

  当我们指定一个数量是无符号类型时,那么其最高位的1或0,和其它位一样,用来表示该数的大小。 

当我们指定一个数量是无符号类型时,此时,最高数称为“符号位”。为1时,表示该数为负值,为0时表示为正值。 

  3、无符号数和有符号数的范围区别。 

无符号数中,所有的位都用于直接表示该值的大小。有符号数中最高位用于表示正负,所以,当为正值时,该数的最大值就会变小。我们举一个字节的数值对比: 

无符号数: 11111111    值:255

1* 27 + 1* 26 + 1* 25 + 1* 24 + 1* 23 + 1* 22 + 1* 21 + 1* 20

有符号数: 01111111    值:127         

1* 26 + 1* 25 + 1* 24 + 1* 23 + 1* 22 + 1* 21 + 1* 20

 同样是一个字节,无符号数的最大值是255,而有符号数的最大值是127。原因是有符号数中的最高位被挪去表示符号了。并且,我们知道,最高位的权值也是最高的(对于1字节数来说是2的7次方=128),所以仅仅少于一位,最大值一下子减半。 

不过,有符号数的长处是它可以表示负数。因此,虽然它的在最大值缩水了,却在负值的方向出现了伸展。我们仍一个字节的数值对比: 

无符号数:                        0 ----------------- 255 

有符号数:         -128 --------- 0 ---------- 127 

同样是一个字节,无符号的最小值是 0 ,而有符号数的最小值是-128。所以二者能表达的不同的数值的个数都一样是256个。只不过前者表达的是0到255这256个数,后者表达的是-128到+127这256个数。 

一个有符号的数据类型的最小值是如何计算出来的呢? 

有符号的数据类型的最大值的计算方法完全和无符号一样,只不过它少了一个最高位(见第3点)。但在负值范围内,数值的计算方法不能直接使用1* 26 + 1* 25 的公式进行转换。在计算机中,负数除为最高位为1以外,还采用补码形式进行表达。所以在计算其值前,需要对补码进行还原。
这里,先直观地看一眼补码的形式: 

在10进制中:1 表示正1,而加上负号:-1 表示和1相对的负值。 

那么,我们会很容易认为在2进制中(1个字节): 0000 0001 表示正1,则高位为1后:1000 0001应该表示-1。 

然而,事实上计算机中的规定有些相反,请看下表: 

二进制值(1字节)

十进制值 

10000000

-128 

10000001

 -127 

10000010

-126 

10000011

 -125 

……

……

11111110

-2 

11111111

-1 


首先我们看到,从-1到-128,其二进制的最高位都是1,正如我们前面的学。 负数最高为为1

然后我们有些奇怪地发现,1000 0000 并没有拿来表示 -0;而1000 0001也不是拿来直观地表示-1。事实上,-1 用1111 1111来表示。 

怎么理解这个问题呢?先得问一句是-1大还是-128大? 

当然是 -1 大。-1是最大的负整数。以此对应,计算机中无论是字符类型,或者是整数类型,也无论这个整数是几个字节。它都用全1来表示 -1。比如一个字节的数值中:1111 1111表示-1,那么,1111 1111 - 1 是什么呢?和现实中的计算结果完全一致。1111 1111 - 1 = 1111 1110,而1111 1110就是-2。这样一直减下去,当减到只剩最高位用于表示符号的1以外,其它低位全为0时,就是最小的负值了,在一字节中,最小的负值是1000 0000,也就是-128。 

我们以-1为例,来看看不同字节数的整数中,如何表达-1这个数: 

字节数

二进制值

 十进制值 

单字节数

11111111

 -1 

双字节数

 11111111 11111111

 -1 

四字节数

11111111 11111111 11111111 11111111

 -1 


可能有同学这时会混了:为什么 1111 1111 有时表示255,有时又表示-1?所以我再强调一下前面所说的第2点:你自已决定一个数是有符号还是无符号的。写程序时,指定一个量是有符号的,那么当这个量的二进制各位上都是1时,它表示的数就是-1;相反,如果事选声明这个量是无符号的,此时它表示的就是该量允许的最大值,对于一个字节的数来说,最大值就是255。 

 我们已经知道计算机中,所有数据最终都是使用二进制数表达。 也已经学会如何将一个10进制数如何转换为二进制数。 不过,我们仍然没有学习一个负数如何用二进制表达。 
比如,假设有一 int 类型的数,值为5,那么,我们知道它在计算机中表示为: 

    00000000 00000000 00000000 00000101 

5转换成二制是101,不过int类型的数占用4字节(32位),所以前面填了一堆0。 现在想知道,-5在计算机中如何表示? 在计算机中,负数以其正值的补码形式表达。 

什么叫补码呢?这得从原码,反码说起。 

原码:一个整数,按照绝对值大小转换成的二进制数,最高为为符号位,称为原码。 红色为符号位

比如 00000000 00000000 00000000 00000101 是 5的 原码。 
      10000000 00000000 00000000 00000101  是-5的原码

 反码:将二进制除符号位数按位取反,所得的新二进制数称为原二进制数的反码。 正数的反码为原码,负数的反码是原码符号位外按位取反。 
 取反操作指:原为1,得0;原为0,得1。(1变0; 0变1) 

正数:正数的反码与原码相同。

负数:负数的反码,符号位为“1”,数值部分按位取反。

比如:将10000000 00000000 00000000 00000101除符号位每一位取反,

        得11111111 11111111 11111111 11111010。 

称:11111111 11111111 11111111 11111010 是 10000000 00000000 00000000 00000101 的反码。 

反码是相互的,所以也可称: 

11111111 11111111 11111111 11111010 和 10000000 00000000 00000000 00000101 互为反码。 

补码:反码加1称为补码。 
正数:正数的补码和原码相同。

负数:按照规则来
也就是说,要得到一个数的补码,先得到反码,然后将反码加上1,所得数称为补码。 

11111111 11111111 11111111 11111010 是 10000000 00000000 00000000 00000101(-5) 的反码。 
加1得11111111 11111111 11111111 11111011

所以,-5 在计算机中表达为:11111111 11111111 11111111 11111011。转换为十六进制:0xFFFFFFFB。 

再举一例,我们来看整数-1在计算机中如何表示。 

假设这也是一个int类型,那么: 

1、先取-1的原码:        10000000 00000000 00000000 00000001 

2、除符号位取反得反码:11111111 11111111 11111111 11111110 

3、加1得补码:            11111111 11111111 11111111 11111111 

可见,-1在计算机里用二进制表达就是全1。16进制为:0xFFFFFF。 

计算机中的带符号数用补码表示的优点: 

1、负数的补码与对应正数的补码之间的转换可以用同一种方法——求补运算完成,可以简化硬件; 
2、可将减法变为加法,省去减法器; 
3、无符号数及带符号数的加法运算可以用同一电路完成。 

可得出一种心算求补的方法——从最低位开始至找到的第一个1均不变,符号位不变,这之间的各位“求反”(该方法仅用于做题)。

方法

例1

例2

1. 从右边开始,找到第一个'1'

10101001

10101100

2. 反转从这个'1'之后开始到最左边(不包括符号位)的所有位

11010111

11010100



一:CPU只会根据输入信号进行逻辑运算,在硬件级别是没有有符号无符号的概念,运算结束会根据运算前的信号和输出信号来设置一些标志位,是不是有符号由写程 序的人决定,标志位要看你把操作数当有符号还是无符号来选择,就像内存中的数据,你可以按照需要来解析,原始数据在那里,你要按什么数据格式来解析在于自 己的选择,所以玩汇编的要做到心里有数,加减法只有一套指令,因为这一套指令同时适用于有符号和无符号。下面这些指令:mul div movzx … 是处理无符号数的,而这些:imul idiv movsx … 是处理有符号的。举例来说:
内存里有 一个字节x 为:0x EC ,一个字节 y 为:0x 02 。当把x,y当作有符号数来看时,x = -20 ,y = +2 。当作无符号数看时,x = 236 ,y = 2 。下面进行加运算,用 add 指令,得到的结果为:0x EE ,那么这个 0x EE 当作有符号数就是:-18 ,无符号数就是 238 。所以,add 一个指令可以适用有符号和无符号两种情况。(呵呵,其实为什么要补码啊,就是为了这个呗,:-))
乘法运算就不行了,必须用两套指令,有符号的情况下用imul 得到的结果是:0x FF D8 就是 -40 。无符号的情况下用 mul ,得到:0x 01 D8 就是 472 。

二、

C又是可怕的,因为它把机器层面的所有的东西都反应了出来,像这个有没有符号的问题就是一例(java就不存在这个问题,因为它被设计成所有的整数都是有符号的)。为了说明c的可怕特举一例:
#include <stdio.h>
#include <string.h>

int main()
{
        int x = 2;
        char * str = "abcd";
        int y = (x - strlen(str) ) / 2;
       
        printf("%d\n",y);
}
结果应该是 -1 但是却得到:2147483647 。为什么?因为strlen的返回值,类型是size_t,也就是unsigned int ,与 int 混合计算时类型被自动转换了,结果自然出乎意料。。。
观察编译后的代码,除法指令为 div ,意味无符号除法,即将-2看做无符号数了。
解决办法就是强制转换,变成 int y = (int)(x - strlen(str) ) / 2; 强制向有符号方向转换(编译器默认正好相反),这样一来,除法指令编译成 idiv 了。我们知道,就是同样状态的两个内存单位,用有符号处理指令 imul ,idiv 等得到的结果,与用无符号处理指令mul,div等得到的结果,是截然不同的!所以牵扯到有符号无符号计算的问题,特别是存在讨厌的自动转换时,要倍加小心!(这里自动转换时,无论gcc还是cl都不提示!!!)
为了避免这些错误,建议,凡是在运算的时候,确保你的变量都是 signed 的。

三、自动类型转化时的,短字节向长字节转化时,有符号数会符号扩展,无符号数会0扩展;长字节向短字节转化时,会自动截取高位,留下低位字节。特别在做算术运算时,比如乘除法,就可能涉及到有符号数自动转化为无符号数,从而采用不同的指令处理。

例如:下面的代码输出是什么,为什么?

void foo(void)
{
unsigned int a = 6;
int b = -20;
(a+b > 6) ? puts("> 6") : puts("<= 6");
}
    这个问题测试你是否懂得C语言中的整数自动转换原则,我发现有些开发者懂得极少这些东西。不管如何,这无符号整型问题的答案是输出是 ”>6”。原因是当表达式中存在有符号类型和无符号类型时所有的操作数都自动转换为无符号类型。因此-20变成了一个非常大的正整数,所以该表达式 计算出的结果大于6。这一点对于应当频繁用到无符号数据类型的嵌入式系统来说是丰常重要的。如果你答错了这个问题,你也就到了得不到这份工作的边缘。

扩展一下,如果是这段代码呢?

void foo(void)
{
unsigned int a = 6;
int b = -20;
printf("%d\n",a+b);
(a+b > 6) ? puts("> 6") : puts("<= 6");
}
结果是输出:-14   >6   

为什么?我们要注意,在printf()中,a+b也是转换为unsigned int(0xF2)的,但是%d要求又是按照有符号数输出,所以0xf2当成有符号数输出了-14。

四。特别注意在有常数的算数表达式中,往往有隐含的数据类型转化,因为整数常量并没有明确的被指出其的数据类型,

整常数在不加特别说明时总是正值。如果需要的是负值,则负号“-”必须放置于常数表达式的前面。

每个常数依其值要给出一种类型。当整常数应用于一表达式时,或出现有负号时,常数类型自动执行相应的转换,十进制常数可等价于带符号的整型或长整型,这取决于所需的常数的尺寸。

八进制和十六进制常数可对应整型、无符号整型、长整型或无符号长整型,具体类型也取决于常数的大小。如果常数可用整型表示,则使用整型。如果常数值大于一 个整型所能表示的最大值,但又小于整型位数所能表示的最大数,则使用无符号整型。同理,如果一个常数比无符号整型所表示的值还大,则它为长整型。如果需 要,当然也可用无符号长整型。

但是,可以在一个常数后面加一个字母l或L强制其数据类型,则认为是长整型。如1 0 L、7 9 L、0 1 2 L、0 11 5 L、0 X A L、0 x 4 f L等。

L, U, LU,叫类型后缀,.

 一般在程序中出现3种数据.我把它们叫,变量,常量,字面量.
变量,常量一般都已经规定了类型了的,所以后缀针对的是字面量.
由于语言默认,整数是int型.即字面量 12 是 int型的.
如果要表示 长整型的12 就得加后缀 12L,无符号的 12U,无符号长整型的12UL.
具体这些有什么用,你需要了解整数在内存中的存放形式...存放长度(位)...




1 0
原创粉丝点击