C语言中的EOF和feof()

来源:互联网 发布:中国少儿编程培训市场 编辑:程序博客网 时间:2024/05/16 06:21

原文http://blog.csdn.net/flyyyri/article/details/5084981


在c语言中经常用EOF和feof()来判断文件的结束,现将有关用法总结如下:

  1. 定义
    EOF是End Of File 的缩写是c语言中标准库中定义的宏,定义为:#define  EOF  (-1);  
    feof() 用于测试流文件的结束,有宏和函数两种定义:
    宏定义: #define feof(_stream)  ((_stream)->_flag & _IOEOF),其中_IOEOF的为:#define _IOEOF 0x0010
    函数定义:int feof( FILE *stream );
  2. 说明
          EOF的值为-1,是int类型数据,在32位系统中,可以表示为0xFFFFFFFF; EOF 不是一个字符,也不是文件中实际存在的内容。EOF不但能表示读文件到了结尾这一状态,它还能表示 I/O 操作中的读、写错误(可以用 ferror() 来检测)以及其它一些关联操作的错误状态;
          feof()只用于测试流文件的结束,当到达结尾时,返回非0;当文件内部位置指针指向文件结束时,并未立即置位FILE结构中的文件结束标记,只有再执行一次读文件操作,才会置位结束标志,此后调用feof才会返回为真。
          函数如fgetc或getc返回EOF并不一定表示文件结束,当读取文件出错时也会返回EOF,仅凭返回-1就认为文件结束是错误的;正因为如此,我们需要feof()来判断文件是否结束,当然用feof()来判断文件结束时也需要判断读取操作是否出错,这时可以用ferror()来判断,当其为真时表示有错误发生。在实际的程序中,应该每执行一次文件操作,就用用ferror函数检测是否出错。
  3. 举例
    假设文件指针fp指向某个文件,文件中有字符串“hello”,下面的代码将输出hello外,还将输出一个结束字符EOF(EOF是fgetc函数的返回值,并不是文件中存在EOF):
    [cpp] view plaincopy
    1. int c=0;  
    2. while(!feof(fp))  
    3. {  
    4.     int c=fgetc(fp);  
    5.     printf("%c:/t%x/n",c,c);  
    6. }  


    其原因就是当内部指针指向结尾时,还要执行一次读操作,文件结束标记才置位,而下面的代码将只输出“hello”不输出文件结束符:
    [cpp] view plaincopy
    1. int c;  
    2.         c=fgetc(fp);      
    3. while(!feof(fp))  
    4. {     
    5.     printf("%c:/t%x/n",c,c);  
    6.     c=fgetc(fp);  
    7. }  


    当文件内部指针指向结束位置时,先执行一次读操作,置位文件结束标记,while循环立即结束。
  4. 需要注意的几点

    (1) 字节的读取和写入

          fgetc或getc返回一个int类型数据,在正常的情况下, fgetc或getc以 unsigned char 的方式读取文件流, 扩张为一个整数,并返回. 换言之, fgetc 从文件流中取一个字节, 并加上24个零,成为一个小于256的整数,然后返回。

    [cpp] view plaincopy
    1. int c;  
    2. while ((c = fgetc (rfp))!= -1) // -1就是 EOF  
    3.     fputc (c, wfp);  
     
          在正常读取的情况下, 上述fgetc函数返回的整数均小于256, 即0x0~0xFF. 而读不出 0xFFFFFFFF;而写入时fputc 中的 c 虽然是整数, 但在 fputc 将其写入文件流之前, 又把整数的高24位去掉了, 所以如果用fputc把 0xFFFFFFFF 往文件里头写, 高24位被屏蔽,写入的将是 0xFF. 

    (2) fgetc返回值的类型(以(1)中的代码为例)

           fgetc()返回类型为int,我们可以将其返回值赋给一个int类型变量,如(1)中的代码,即使是遇到字符0xFF(blank的ascii码,不是EOF),while循环也不会结束,因为0xFF会被转化0x000000FF,显然这与0xFFFFFFFF(EOF)是不相等的,这时能完成正确复制;
          如果用一个char 类型的变量c 来接收fgetc()的返回值,会出现什么情况? 假定下一个读取的字符为0xFF 则:
    char c = fgetc (rfp); // fgetc(rfp)的值为 0x000000FF, 然后强制转化为char类型:c = 0xFF
    while(c != EOF) ;     // 字符与整数比较? c 被带符号(signed)扩展为0xFFFFFFFF,条件成立,文件复制提前退出,故遇到空格字符时就退出,不能完成复制;

          如果将c 定义为unsigned char,当读到文件末尾,返回 EOF 也就是 -1 时:
    unsigned char c = fgetc (rfp);// fgetc (rfp)的值为EOF,即-1,即0xFFFFFFFF,然后强制转化为uchar类型, c=0xFF
    while( c!= -1)  ;                        // c 被扩展为 0x000000FF, 永远不会等于 0xFFFFFFFF,所以这次虽然能正确复制 0xFF, 但却不能判断文件结束. 事实上,在 c 为 uchar 时,c != -1 是永远成立的!

          因此,只能将c定义成int类型的变量,这样才与fgetc返回类型一致。
0 0
原创粉丝点击