文件结束符在windows和linux中的区别

来源：互联网发布：手机号码归属地数据库编辑：程序博客网时间：2024/06/11 15:30

以前在windows下写一段文本读写的程序。
通常会用到while（！file.eof()）{}来读取文件，并判断是否读完
可是最近在linux下面才发现不一样了
原来在windows下，文本读完到没有内容的时候，file.eof()自己就返回1，可是在linux里面，文本内容都读完的时候，还有一个文件结束符没有读完，就是说linux把EOF也当成文本的一部分，而windows则不这么认为。所以在编程的时候，会有一些出入。经过自己一番思索，终于想通了这些区别。
在百度知道上想验证是否是这样，果然，有一网友也碰到相同的疑惑，回答者回答的比较精彩。放在这里，以供参考。

问题是：

文件结束符EOF

悬赏分：10 - 解决时间：2007-4-15 22:15

#include<iostream.h>
#include<fstream.h>
void main()
{
 char temp;
 ifstream in("input.txt");
 int count=0;
 while(!in.eof())
 {
  while(!in.eof())
   {
   in>>temp;
   cout<<temp<<endl;
   count++;
   }
 }
 cout<<count<<endl;
}
input.txt文件里是abc,输出的结果为什么是
a
b
c
c
4
而不是
a
b
c
3

问题补充：

#include<iostream.h>
#include<fstream.h>
void main()
{
 char temp;
 ifstream in("input.txt");
 ofstream out("output.txt");
 for(int index=0;index<5;index++){
  if(!in.eof()){
   in>>temp;
   cout<<temp<<endl;
   if(temp<='z' && temp>='a') {
    temp=-'a';
    }
   else if(temp<='Z'&& temp>='A'){
    temp=-'A';
    }
   }
  else {
   temp='x'-'a';}
 }

}
input.txt里是abc,输出是abc?,而不是abc,这又怎么回事，和上面的是一个错吗？

提问者：孤城吹雪85 - 一级

最佳答案

哦，这个不是1楼说的那个样子的。eof是文件结束的标志，事实上是-1.可以稍微修改一下楼主的程序来做证明：
while(!in.eof()) 
{ 
temp = in.get(); 
cout<<int(temp)<<endl; 
count++; 
}
这个时候，会发现在输出count之前输出的最后一个是-1.

但是为什么会输出-1（也就是文件结束符号）呢？in.eof()返回的是in里面的EOF变量，这个变量在in读到文件的结束符时才会变为1。也就是说，只有当in.get()读过了eof的时候，in中的EOF变量才会编程1，in.get()才能返回1。

那为什么按照楼主给的代码里面的in>>temp写法，最后会输出两个c，而和get的输出不一样呢？这个是因为>>在处理的时候，如果碰到读入的是文件结束符，是不会将其写道缓存中的，那样的话，缓存中的字符串还是在读入eof之前的那个字符（这个代码里面也就是'c'),然后再赋值给temp的还是'c'了。

那如何可以比较完美的修改上面的代码呢？对于文件输入流来说，有一个指针指向的是当前读的字符串的下一位，每读一位，指针就往下移一位。就比如一个只有abc的input.txt的文件，我们现在读完了c，那么指针的状态是大致是下面这个样子：
a
b
c
EOF <--

注意，这个时候，in.eof()还不返回1，因为in这个输入流还没有读EOF这个文件结束符，但是in有一个函数peek()是读当前指针指向的这个位置的符号的。那么如果用in.peek() == EOF 来最为判断的标准就比较好了。楼主的例子写成

while(in.peek() != EOF) 
{ 
in>>temp; 
cout<<temp<<endl; 
count++; 
} 
就可以了。

顺便说一句，第一段代码里面while的里面再嵌一个while没有必要吧...
还有，无论读还是写，最好都要养成在操作完毕调用close()关闭流的好习惯:)

0 0