文件结束符在windows和linux中的区别

来源:互联网 发布:手机号码归属地 数据库 编辑:程序博客网 时间:2024/06/11 15:30

以前在windows下写一段文本读写的程序。
通常会用到while(!file.eof()){}来读取文件,并判断是否读完
可是最近在linux下面才发现不一样了
原来在windows下,文本读完到没有内容的时候,file.eof()自己就返回1,可是在linux里面,文本内容都读完的时候,还有一个文件结束符没有读完,就是说linux把EOF也当成文本的一部分,而windows则不这么认为。所以在编程的时候,会有一些出入。经过自己一番思索,终于想通了这些区别。
在百度知道上想验证是否是这样,果然,有一网友也碰到相同的疑惑,回答者回答的比较精彩。放在这里,以供参考。

问题是:

文件结束符EOF
文件结束符在windows和linux中的区别 - phpking - phpking的博客 悬赏分:10 - 解决时间:2007-4-15 22:15
#include<iostream.h>
#include<fstream.h>
void main()
{
char temp;
ifstream in("input.txt");
int count=0;
while(!in.eof())
{
while(!in.eof())
{
in>>temp;
cout<<temp<<endl;
count++;
}
}
cout<<count<<endl;
}
input.txt文件里是abc,输出的结果为什么是
a
b
c
c
4
而不是
a
b
c
3
问题补充:
#include<iostream.h>
#include<fstream.h>
void main()
{
char temp;
ifstream in("input.txt");
ofstream out("output.txt");
for(int index=0;index<5;index++){
if(!in.eof()){
in>>temp;
cout<<temp<<endl;
if(temp<='z' && temp>='a') {
temp=-'a';
}
else if(temp<='Z'&& temp>='A'){
temp=-'A';
}
}
else {
temp='x'-'a';}
}

}
input.txt里是abc,输出是abc?,而不是abc,这又怎么回事,和上面的是一个错吗?
提问者: 孤城吹雪85 - 一级
最佳答案
哦,这个不是1楼说的那个样子的。eof是文件结束的标志,事实上是-1.可以稍微修改一下楼主的程序来做证明:
while(!in.eof())
{
temp = in.get();
cout<<int(temp)<<endl;
count++;
}
这个时候,会发现在输出count之前输出的最后一个是-1.

但是为什么会输出-1(也就是文件结束符号)呢?in.eof()返回的是in里面的EOF变量,这个变量在in读到文件的结束符时才会变为1。也就是说,只有当in.get()读过了eof的时候,in中的EOF变量才会编程1,in.get()才能返回1。

那为什么按照楼主给的代码里面的in>>temp写法,最后会输出两个c,而和get的输出不一样呢?这个是因为>>在处理的时候,如果碰到读入的是文件结束符,是不会将其写道缓存中的,那样的话,缓存中的字符串还是在读入eof之前的那个字符(这个代码里面也就是'c'),然后再赋值给temp的还是'c'了。

那如何可以比较完美的修改上面的代码呢?对于文件输入流来说,有一个指针指向的是当前读的字符串的下一位,每读一位,指针就往下移一位。就比如一个只有abc的input.txt的文件,我们现在读完了c,那么指针的状态是大致是下面这个样子:
a
b
c
EOF <--

注意,这个时候,in.eof()还不返回1,因为in这个输入流还没有读EOF这个文件结束符,但是in有一个函数peek()是读当前指针指向的这个位置的符号的。那么如果用in.peek() == EOF 来最为判断的标准就比较好了。楼主的例子写成

while(in.peek() != EOF)
{
in>>temp;
cout<<temp<<endl;
count++;
}
就可以了。

顺便说一句,第一段代码里面while的里面再嵌一个while没有必要吧...
还有,无论读还是写,最好都要养成在操作完毕调用close()关闭流的好习惯:)

0 0
原创粉丝点击