<<C和指针>>第1章之编程练习心得20140704
来源:互联网 发布:巴基斯坦人 知乎 编辑:程序博客网 时间:2024/06/04 00:56
有些错误非得自己犯过了才会记得住,非得自己理解了分析了才记得住。比如说用getchar(),fgetc()之类的函数来接收字符时,需要一个变量暂存,而且还要判断是否读到EOF,这个在 C陷阱与缺陷 里面看到过,现在用到又忽略了。我们习惯于用char ch;while( ( c = getchar() ) != EOF ){} 来接收数据。这样是存在问题的,虽然getchar等是接收字符,但是它的返回值却是int型,为什么呢?因为EOF在stdio中定义为-1,不同于任何一个字符。负数在计算机中的存储形式为2的补码,那么-1 就是 0xFFFFFFFF了。char型肯定无法容纳所有可能的字符(字符包括字母,数字,符号,特别是还有汉字!!),先看看字符的可能长度:
1.ASCII编码中,1个英文字符存储需要1个字节,
2.GB2312或GBK编码中,一个汉字字符存储需要2个字节,
3.UTF-8编码中,一个英文字符存储需要1个字节,一个汉字字符需要3到4个字节。
4.UTF-16编码中,英文和汉字都需要2个字节。
5.UTF-32编码中,任何字符都需要4个字节。
这下大家应该清楚了吧,不要以为字符都是一个字节的。
特别是无法容纳下EOF,来讨论下char ch会带来什么隐患:
1.假设你输入了一个2个字节的字符吧,0x3CFF,我也不知道代表什么,那么getchar返回0x3CFF,截取低字节给ch,ch=0xFF,然后ch要与EOF比较,ch会扩展为32位。
如果编译器认为ch是有符号型的,ch就被扩展为0XFFFFFFFF,这下可好,误认为是EOF了,while循环跳出,提前停止输入。
2.假设真的碰到了EOF吧,截取为FF给ch,如果编译器认为ch是无符号型的,ch就被扩展为0x000000FF,这样永远也见不到EOF了!陷入死循环。
3.那为什么我偏偏使用了char ch,但是没出问题呢?完全是巧合,许多编译器对上述表达式的实现并不正确,的确对getchar的返回值做了截断处理,但是它们在比较表达式中并不是比较c与EOF,而是比较getchar的函数返回值与EOF,编译器如果这样,那么就能正常“运行”了。
正确的声明:
#include <stdio.h>int main(){ int c; /* 改成:int c 就正确了 */ while( ( c = getchar() ) != EOF ) { putchar( c ); } return 0;}
- <<C和指针>>第1章之编程练习心得20140704
- <<C和指针>>第1章之编程练习心得20140702
- <<C和指针>>第1章之编程练习心得20140703
- <<C和指针>>第1章之编程练习心得20140705
- <<C和指针>>第2章之编程练习心得20140709
- C和指针之字符串编程练习1
- C和指针第四章编程练习
- C和指针第二章编程练习
- C和指针第三章--编程练习
- C和指针编程练习---6.18.1
- C和指针-编程练习
- C和指针之数组之编程练习2
- C Primer Plus 第10章 数组和指针 编程练习
- C和指针之数组编程练习5 (矩阵相乘)
- C和指针之字符串编程练习6
- C和指针之字符串编程练习3
- C和指针 第六章 编程练习 第一题
- C和指针第九章课后习题编程练习
- wikioi高精度练习之减法c++
- linux驱动学习笔记1--字符型驱动的编写
- HDU 1847 Good Luck in CET-4 Everybody! (博弈论sg)
- Android RecyclerView And CardView
- ListView的Item不可点击和Item布局重复问题
- <<C和指针>>第1章之编程练习心得20140704
- HDU4089-Activation(概率DP)
- php pconnect 长连接原理
- 背景设计
- 后缀数组(长度不小于k的公共子串的个数)
- NYOJ-106 背包问题
- Listview中显示不同的视图布局
- 中国黑客传说:游走在黑暗中的精灵
- php学习之道:WSDL详解(一)