程序员面试宝典中的一个错误 char * b=(char *)&a

来源：互联网发布：最好的收音机软件编辑：程序博客网时间：2024/05/23 22:56

本文转自：http://www.cppblog.com/wuzimian/archive/2012/05/23/175925.aspx

1 #include<iostream>
2 using namespace std;
3 int main()
4 {
5      unsigned int a = 0xFFFFFFF7;
6      unsigned char i = (unsigned char)a;
7     char* b = (char*)&a;
8
9     printf("%08x, %08x\n", i, *b);
10  }

程序结果输出：fffffff7,《宝典》中解释为

1 unsigned int* p = &a; // p中的内容是的地址，即p指向a
2 char* b = (char*)p; // 此处的强制转换只是使b也指向a而已
3 // 这里是char类型的指针转换，而不是char类型的转换，影响的只是指针的寻址

《宝典》认为最终b的指向和&a一样，所以程序输出就是&a指向的：fffffff7，这个解释显然是不对的，如果我们把a的值改为0x123456f7,程序也会输出fffffff7，
而按照《宝典》的说法，应该输出123456f7才对。
正确的解释是怎样的呢？
首先我们要有这么一个认识：在X86系列的机器中，数据的存储是“小端存储”，小端存储的意思就是，对于一个跨多个字节的数据，其低位存放在低地址单元，其高位放在高
地址单元。比如一个 int 型的数据ox12345678，假如存放在0x00000000,0x00000001,0x00000002,0x00000003这四个内存单元中，那么ox00000000中放的是
低位的ox78，而ox00000003中放的是高位的0x12，以此类推。
有了以上的认识，我们可以继续分析上面的程序为什么输出fffffff7：

char* b = (char*)&a;这句话到底干了什么事呢？其实说来也简单，&a可以认为是个指向 unsigned int类型数据的指针对吧，（char *）&a则把&a强制转换成 char *类型
的指针，并且这个时候发生了截断！截断后，指针b只指向oxf7这个数据（为什么b指向最低位的oxf7而不是最高位的oxff？想想上面刚刚讲过的"小端存储"吧，低地址单元存
放低位数据，），又由于指针b是 char *型的，属于有符号数，所以有符号数0xf7在printf（）的作用下输出fffffff7( 这个过程中其实发生了参数类型提升default argument
promotions），因为我对C语言不是很了解，所以看这里，

http://www.spongeliu.com/%E8%AF%AD%E8%A8%80%E5%AD%A6%E4%B9%A0/clanguage/ctypetransfer/

讲的比较清楚了。

参考：

http://blog.csdn.net/race604/article/details/6725475

或者我们可以通过汇编代码更直观的看内部的情况：

int main()
{
01321380 push        ebp
01321381 mov         ebp,esp
01321383 sub         esp,0E4h
01321389 push        ebx
0132138A push        esi
0132138B push        edi
0132138C lea         edi,[ebp-0E4h]
01321392 mov         ecx,39h
01321397 mov         eax,0CCCCCCCCh
0132139C rep stos    dword ptr es:[edi]
                unsigned int a = 0xFFFFFF65;
0132139E mov         dword ptr [a],0FFFFFFF7h
                unsigned char i = (unsigned char)a;
013213A5 mov         al,byte ptr [a]
013213A8 mov         byte ptr [i],al
      char* b = (char*)&a;
013213AB lea         eax,[a]                    //取a的地址：0x0018FD70
013213AE mov         dword ptr [b],eax //指针b的值为：0x0018FD70，该位置放着0xF7；

                printf("%08x, %08x\n", i, *b);
013213B1 mov         eax,dword ptr [b] //把b的值，也就是0x0018FD70放到EAX中；
013213B4 movsx       ecx,byte ptr [eax] //这句话最关键，byte ptr [eax]就是把0xF7取出来，注意命令是byte ptr哦。然后movsx指令是按符号扩展，放到ecx中，按符号扩展其实就是将char扩展成int，然后printf中格式说明的‘x’则说明将这个int按16进制输出，也就是fffffff7了，而如果将‘x’变成‘d’，按整数输出，那么程序就会输出-9
013213B7 mov         esi,esp                   //上一句的byte ptr 就反映了我们上面说的 char* b = (char*)&a 截取的问题
013213B9 push        ecx
013213BA movzx       edx,byte ptr [i]  //注意因为i是unsigned char（无符号），所以按0扩展成unsigned int
013213BE push        edx
013213BF push        offset string "%08x, %08x\n" (1325830h)
013213C4 call        dword ptr [__imp__printf (13282B0h)]
013213CA add         esp,0Ch
013213CD cmp         esi,esp
013213CF call        @ILT+295(__RTC_CheckEsp) (132112Ch)
}