文件操作专题

来源:互联网 发布:福建网络服务公司 编辑:程序博客网 时间:2024/05/20 11:51

文件分类

v 按文件的逻辑结构:

l  记录文件:由具有一定结构的记录组成(定长和不定长)

l  流式文件:由一个个字符(字节)数据顺序组成

v 按存储介质:

l  普通文件:存储介质文件(磁盘、磁带等)

l  设备文件:非存储介质(键盘、显示器、打印机等)

v 按数据的组织形式:

l  文本文件: ASCII文件,每个字节存放一个字符的ASCII码

l  二进制文件:数据按其在内存中的存储形式原样存放



v 每个文件都以文件名为标识,I/O设备的文件名是系统定义的,如:

v COM1或AUX——第一串行口,附加设备

v COM2——第二串行口,此外,还可能有COM3、COM4等

v CON——控制台(console),键盘(输入用)或显示器(输出用)

v LPT1或PRN——第一并行口或打印机

v LPT2——第二并行口,还可能有LPT3等

v NUL——空设备

v 磁盘文件可以由用户自己命名,但上述被系统(windows和dos下均是如此)保留的设备名字不能用作文件名,如不能把一个文件命名为CON(不带扩展名)或CON.TXT(不带扩展名)。


v 流概念

v 流是一个动态的概念,可以将一个字节形象地比喻成一滴水,字节在设备、文件和程序之间的传输就是流,类似于水在管道中的传输,可以看出,流是对输入输出源的一种抽象,也是对传输信息的一种抽象。通过对输入输出源的抽象,屏蔽了设备之间的差异,使程序员能以一种通用的方式进行存储操作,通过对传输信息的抽象,使得所有信息都转化为字节流的形式传输,信息解读的过程与传输过程分离。

v C语言中,I/O操作可以简单地看作是从程序移进或移出字节,这种搬运的过程便称为流(stream)。程序只需要关心是否正确地输出了字节数据,以及是否正确地输入了要读取字节数据,特定I/O设备的细节对程序员是隐藏的。



v 文件处理方法

v 缓冲文件系统:高级文件系统,系统自动为正在使用的文件开辟内存缓冲区

v 非缓冲文件系统:低级文件系统,由用户在程序中为每c文件设定缓冲区



v 缓冲文件系统理解:文件句柄



文件操作API 


标准文件的读写

1.文件的打开fopen()

文件的打开操作表示将给用户指定的文件在内存分配一个FILE结构区,并将该结构的指针返回给用户程序,以后用户程序就可用此FILE指针来实现对指定文件的存取操作了。当使用打开函数时,必须给出文件名、文件操作方式(读、写或读写),如果该文件名不存在,就意味着建立(只对写文件而言,对读文件则出错),并将文件指针指向文件开头。若已有一个同名文件存在,则删除该文件,若无同名文件,则建立该文件,并将文件指针指向文件开头。

fopen(char*filename,char *type);

其中*filename是要打开文件的文件名指针,一般用双引号括起来的文件名表示,也可使用双反斜杠隔开的路径名。而*type参数表示了对打开文件的操作方式。其可采用的操作方式如下:

 

方式           含义

"r"             打开,只读

"w"             打开,文件指针指到头,只写

"a"             打开,指向文件尾,在已存在文件中追加

"rb"            打开一个二进制文件,只读

"wb"            打开一个二进制文件,只写

"ab"            打开一个二进制文件,进行追加

"r+"            以读/写方式打开一个已存在的文件

"w+"            以读/写方式建立一个新的文本文件

"a+"            以读/写方式打开一个文件文件进行追加

"rb+"           以读/写方式打开一个二进制文件

"wb+"           以读/写方式建立一个新的二进制文件

"ab+"           以读/写方式打开一个二进制文件进行追加

 

当用fopen(0成功的打开一个文件时,该函数将返回一个FILE指针,如果文件打开失败,将返回一个NULL指针。如想打开test文件,进行写:

 

FILE *fp;

if((fp=fopen("test","w"))==NULL)

{

printf("File cannot be    opened\n");

exit();

}

else

printf("File opened forwriting\n");

                    ……

fclose(fp);

 

       DOS操作系统对同时打开的文件数目是有限制的,缺省值为5,可以通过修改CONFIG.SYS文件改变这个设置。

 

2.关闭文件函数fclose()

文件操作完成后,必须要用fclose()函数进行关闭,这是因为对打开的文件进行写入时,若文件缓冲区的空间未被写入的内容填满,这些内容不会写到打开的文件中去而丢失。只有对打开的文件进行关闭操作时,停留在文件缓冲区的内容才能写到该文件中去,从而使文件完整。再者一旦关闭了文件,该文件对应的FILE结构将被释放,从而使关闭的文件得到保护,因为这时对该文件的存取操作将不会进行。文件的关闭也意味着释放了该文件的缓冲区。

int fclose(FILE*stream);

它表示该函数将关闭FILE指针对应的文件,并返回一个整数值。若成功地关闭了文件,则返回一个0值,否则返回一个非0值。常用以下方法进行测试:

 

if(fclose(fp)!=0)

{

printf("File cannot be closed\n");

exit(1);

}

else

printf("File is now closed\n");

 

当打开多个文件进行操作,而又要同时关闭时,可采用fcloseall()函数,它将关闭所有在程序中打开的文件。

int fcloseall();

该函数将关闭所有已打开的文件,将各文件缓冲区未装满的内容写到相应的文件中去,接着释放这些缓冲区,并返回关闭文件的数目。如关闭了4个文件,则当执行:

n=fcloseall();   时,n应为4。

 

3.文件的读写

(1).读写文件中字符的函数(一次只读写文件中的一个字符)

 

int fgetc(FILE*stream);

intfgetchar(void);

int fputc(intch,FILE *stream);

int fputchar(intch);

       int getc(FILE *stream);

       int putc(int ch,FILE *stream);

其中fgetc()函数将把由流指针指向的文件中的一个字符读出,例如:

   ch=fgetc(fp);

将把流指针fp指向的文件中的一个字符读出,并赋给ch,当执行fgetc()函数时,若当时文件指针指到文件尾,即遇到文件结束标志EOF(其对应值为-1),该函数返回一个-1给ch,在程序中常用检查该函数返回值是否为-1来判断是否已读到文件尾,从而决定是否继续。

 

#include"stdio.h"

main()

{

FILE *fp;

ch ch;

if((fp=fopen("myfile.tex","r"))==NULL)

{

printf("file cannot be opened\n");

exit(1);

}

       while((ch=fgetc(fp))!=EOF) fputc(ch,stdout);

fclose(fp);

}

              

该程序以只读方式打开myfile.txt文件,在执行while循环时,文件指针每循环一次后移一个字符位置。用fgetc()函数将文件指针指定的字符读到ch变量中,然后用fputc()函数在屏幕上显示,当读到文件结束标志EOF时,变关闭该文件。

上面的程序用到了fputc()函数,该函数将字符变量ch的值写到流指针指定的文件中去,由于流指针用的是标准输出(显示器)的FILE指针stdout,故读出的字符将在显示器上显示。又比如:

putc(ch,fp);

该函数执行结构,将把ch表示的字符送到流指针fp指向的文件中去。

在TC中,putc()等价于fput(),getc()等价于fgetc()。

putchar(c)相当于fputc(c,stdout);getchar()相当于fgetc(stdin)。

注意,这里使用char ch,其实是不科学的,因为最后判断结束标志时,是看ch!=EOF,而EOF的值为-1,这显然和char是不能比较的。所以,某些使用,我们都定义成int ch。

 (2).读写文件中字符串的函数

              

char *fgets(char*string,int n,FILE *stream);

char *gets(char*s);

int fprintf(FILE*stream,char *format,variable-list);

int fputs(char*string,FILE *stream);

int fscanf(FILE*stream,char *format,variable-list);

其中fgets()函数将把由流指针指定的文件中n-1个字符,读到由指针stream指向的字符数组中去,例如:

              fgets(buffer,9,fp);

将把fp指向的文件中的8个字符读到buffer内存区,buffer可以是定义的字符数组,也可以是动态分配的内存区。

注意,fgets()函数读到'\n'就停止,而不管是否达到数目要求。同时在读取字符串的最后加上'\0'。

fgets()函数执行完以后,返回一个指向该串的指针。如果读到文件尾或出错,则均返回一个空指针NULL,所以长用feof()函数来测定是否到了文件尾或者是ferror()函数来测试是否出错,例如下面的程序用fgets()函数读test.txt文件中的第一行并显示出来:

         

#include"stdio.h"

main()

{

FILE *fp;

char str[128];

if((fp=fopen("test.txt","r"))==NULL)

{

printf("cannot open file\n");

exit(1);

}

while(!feof(fp))

{

if(fgets(str,128,fp)!=NULL) printf("%s",str);

}

fclose(fp);

}

 

gets()函数执行时,只要未遇到换行符或文件结束标志,将一直读下去。因此读到什么时候为止,需要用户进行控制,否则可能造成存储区的溢出。

fputs()函数想指定文件写入一个由string指向的字符串,'\0'不写入文件。               

fprintf()和fscanf()同printf()和scanf()函数类似,不同之处就是printf()函数是想显示器输出,fprintf()则是向流指针指向的文件输出;fscanf()是从文件输入。

 

下面程序是向文件test.dat里输入一些字符:

 

#include<stdio.h>

main()

 {

     char *s="That's good news";

    int i=617;

    FILE *fp;

    fp=fopne("test.dat", "w");  

    fputs("Your score of TOEFLis",fp);  

    fputc(':', fp);                     

    fprintf(fp, "%d\n", i);             

    fprintf(fp, "%s", s);               

    fclose(fp);

 }

 用DOS的TYPE命令显示TEST.DAT的内容如下所示:

 屏幕显示

    Your score of TOEFL is: 617

    That's good news

 

下面的程序是把上面的文件test.dat里的内容在屏幕上显示出来:

#include<stdio.h>

main()

{

    char *s, m[20];

    int i;

    FILE    *fp;

   fp=fopen("test.dat", "r");   

    fgets(s, 24, fp);            

    printf("%s", s);

    fscanf(fp, "%d",&i);        

    printf("%d", i);

    putchar(fgetc(fp));          

    fgets(m, 17, fp);            

    puts(m);                     

    fclose(fp);

    getch();

}

  运行后屏幕显示:

 Your score of TOEFL is: 617

That's good news

 

4.清除和设置文件缓冲区

 (1).清除文件缓冲区函数:

int fflush(FILE *stream);

int flushall();

 

fflush()函数将清除由stream指向的文件缓冲区里的内容,常用于写完一些数据后,立即用该函数清除缓冲区,以免误操作时,破坏原来的数据。

flushall()将清除所有打开文件所对应的文件缓冲区。

(2).设置文件缓冲区函数

 voidsetbuf(FILE *stream,char *buf);

 voidsetvbuf(FILE *stream,char *buf,int type,unsigned size);

这两个函数将使得打开文件后,用户可建立自己的文件缓冲区,而不使用fopen()函数打开文件设定的默认缓冲区。              

对于setbuf()函数,buf指出的缓冲区长度由头文件stdio.h中定义的宏BUFSIZE的值决定,缺省值为512字节。当选定buf为空时,setbuf函数将使的文件I/O不带缓冲。而对setvbuf函数,则由malloc函数来分配缓冲区。参数size指明了缓冲区的长度(必须大于0),而参数type则表示了缓冲的类型,其值可以取如下值:

 

type 值             含义

        _IOFBF        文件全部缓冲,即缓冲区装满后,才能对文件读写

        _IOLBF        文件行缓冲,即缓冲区接收到一个换行符时,才能对文件读写

_IONBF        文件不缓冲,此时忽略buf,size的值,直接读写文件,不再经过文件缓冲区缓冲

 

5.文件的随机读写函数

前面介绍的文件的字符/字符串读写,均是进行文件的顺序读写,即总是从文件的开头开始进行读写。这显然不能满足我们的要求,C语言提供了移动文件指针和随机读写的函数,它们是:

(1).移动文件指针函数

        long ftell(FILE *stream);

        int rewind(FILE *stream);

        fseek(FILE *stream,long offset,intorigin);

 

 函数ftell()用来得到文件指针离文件开头的偏移量。当返回值是-1时表示出错。

rewind()函数用于文件指针移到文件的开头,当移动成功时,返回0,否则返回一个非0值。

fseek()函数用于把文件指针以origin为起点移动offset个字节,其中origin指出的位置可有以下几种:

 

        origin           数值             代表的具体位置

 

SEEK_SET          0               文件开头

SEEK_CUR          1               文件指针当前位置

SEEK_END          2               文件尾

 

例如:

  fseek(fp,10L,0);

 把文件指针从文件开头移到第10字节处,由于offset参数要求是长整型数,故其数后带L。

fseek(fp,-15L,2);

把文件指针从文件尾向前移动15字节。

 

 (2).文件随机读写函数

 

int fread(void*ptr,int size,int nitems,FILE *stream);

int fwrite(void*ptr,int size,int nitems,FILE *stream);

              

fread()函数从流指针指定的文件中读取nitems个数据项,每个数据项的长度为size个字节,读取的nitems数据项存入由ptr指针指向的内存缓冲区中,

在执行fread()函数时,文件指针随着读取的字节数而向后移动,最后移动结束的位置等于实际读出的字节数。该函数执行结束后,将返回实际读出的数据项数,

这个数据项数不一定等于设置的nitems,因为若文件中没有足够的数据项,或读中间出错,都会导致返回的数据项数少于设置的nitems。当返回数不等于nitems时

,可以用feof()或ferror()函数进行检查。

 

fwrite()函数从ptr指向的缓冲区中取出长度为size字节的nitems个数据项,写入到流指针stream指向的文件中,执行该操作后,文件指针将向后移动,

移动的字节数等于写入文件的字节数目。该函数操作完成后,也将返回写入的数据项数。

 

3.文件的读写

(1).读写文件中字符的函数(一次只读写文件中的一个字符)

 

int fgetc(FILE*stream);

intfgetchar(void);

int fputc(intch,FILE *stream);

int fputchar(intch);

       int getc(FILE *stream);

       int putc(int ch,FILE *stream);

其中fgetc()函数将把由流指针指向的文件中的一个字符读出,例如:

   ch=fgetc(fp);

将把流指针fp指向的文件中的一个字符读出,并赋给ch,当执行fgetc()函数时,若当时文件指针指到文件尾,即遇到文件结束标志EOF(其对应值为-1),该函数返回一个-1给ch,在程序中常用检查该函数返回值是否为-1来判断是否已读到文件尾,从而决定是否继续。

 

#include"stdio.h"

main()

{

FILE *fp;

ch ch;

if((fp=fopen("myfile.tex","r"))==NULL)

{

printf("file cannot be opened\n");

exit(1);

}

       while((ch=fgetc(fp))!=EOF) fputc(ch,stdout);

fclose(fp);

}

              

该程序以只读方式打开myfile.txt文件,在执行while循环时,文件指针每循环一次后移一个字符位置。用fgetc()函数将文件指针指定的字符读到ch变量中,然后用fputc()函数在屏幕上显示,当读到文件结束标志EOF时,变关闭该文件。

上面的程序用到了fputc()函数,该函数将字符变量ch的值写到流指针指定的文件中去,由于流指针用的是标准输出(显示器)的FILE指针stdout,故读出的字符将在显示器上显示。又比如:

putc(ch,fp);

该函数执行结构,将把ch表示的字符送到流指针fp指向的文件中去。

在TC中,putc()等价于fput(),getc()等价于fgetc()。

putchar(c)相当于fputc(c,stdout);getchar()相当于fgetc(stdin)。

注意,这里使用char ch,其实是不科学的,因为最后判断结束标志时,是看ch!=EOF,而EOF的值为-1,这显然和char是不能比较的。所以,某些使用,我们都定义成int ch。

 (2).读写文件中字符串的函数

              

char *fgets(char*string,int n,FILE *stream);

char *gets(char*s);

int fprintf(FILE*stream,char *format,variable-list);

int fputs(char*string,FILE *stream);

int fscanf(FILE*stream,char *format,variable-list);

其中fgets()函数将把由流指针指定的文件中n-1个字符,读到由指针stream指向的字符数组中去,例如:

              fgets(buffer,9,fp);

将把fp指向的文件中的8个字符读到buffer内存区,buffer可以是定义的字符数组,也可以是动态分配的内存区。

注意,fgets()函数读到'\n'就停止,而不管是否达到数目要求。同时在读取字符串的最后加上'\0'。

fgets()函数执行完以后,返回一个指向该串的指针。如果读到文件尾或出错,则均返回一个空指针NULL,所以长用feof()函数来测定是否到了文件尾或者是ferror()函数来测试是否出错,例如下面的程序用fgets()函数读test.txt文件中的第一行并显示出来:

         

#include"stdio.h"

main()

{

FILE *fp;

char str[128];

if((fp=fopen("test.txt","r"))==NULL)

{

printf("cannot open file\n");

exit(1);

}

while(!feof(fp))

{

if(fgets(str,128,fp)!=NULL) printf("%s",str);

}

fclose(fp);

}

 

gets()函数执行时,只要未遇到换行符或文件结束标志,将一直读下去。因此读到什么时候为止,需要用户进行控制,否则可能造成存储区的溢出。

fputs()函数想指定文件写入一个由string指向的字符串,'\0'不写入文件。               

fprintf()和fscanf()同printf()和scanf()函数类似,不同之处就是printf()函数是想显示器输出,fprintf()则是向流指针指向的文件输出;fscanf()是从文件输入。

 

下面程序是向文件test.dat里输入一些字符:

 

#include<stdio.h>

main()

 {

     char *s="That's good news";

    int i=617;

    FILE *fp;

    fp=fopne("test.dat", "w");  

    fputs("Your score of TOEFLis",fp);  

    fputc(':', fp);                     

    fprintf(fp, "%d\n", i);             

    fprintf(fp, "%s", s);               

    fclose(fp);

 }

 用DOS的TYPE命令显示TEST.DAT的内容如下所示:

 屏幕显示

    Your score of TOEFL is: 617

    That's good news

 

下面的程序是把上面的文件test.dat里的内容在屏幕上显示出来:

#include<stdio.h>

main()

{

    char *s, m[20];

    int i;

    FILE    *fp;

   fp=fopen("test.dat", "r");   

    fgets(s, 24, fp);            

    printf("%s", s);

    fscanf(fp, "%d",&i);        

    printf("%d", i);

    putchar(fgetc(fp));          

    fgets(m, 17, fp);            

    puts(m);                     

    fclose(fp);

    getch();

}

  运行后屏幕显示:

 Your score of TOEFL is: 617

That's good news

 

4.清除和设置文件缓冲区

 (1).清除文件缓冲区函数:

int fflush(FILE *stream);

int flushall();

 

fflush()函数将清除由stream指向的文件缓冲区里的内容,常用于写完一些数据后,立即用该函数清除缓冲区,以免误操作时,破坏原来的数据。

flushall()将清除所有打开文件所对应的文件缓冲区。

(2).设置文件缓冲区函数

 voidsetbuf(FILE *stream,char *buf);

 voidsetvbuf(FILE *stream,char *buf,int type,unsigned size);

这两个函数将使得打开文件后,用户可建立自己的文件缓冲区,而不使用fopen()函数打开文件设定的默认缓冲区。              

对于setbuf()函数,buf指出的缓冲区长度由头文件stdio.h中定义的宏BUFSIZE的值决定,缺省值为512字节。当选定buf为空时,setbuf函数将使的文件I/O不带缓冲。而对setvbuf函数,则由malloc函数来分配缓冲区。参数size指明了缓冲区的长度(必须大于0),而参数type则表示了缓冲的类型,其值可以取如下值:

 

type 值             含义

        _IOFBF        文件全部缓冲,即缓冲区装满后,才能对文件读写

        _IOLBF        文件行缓冲,即缓冲区接收到一个换行符时,才能对文件读写

_IONBF        文件不缓冲,此时忽略buf,size的值,直接读写文件,不再经过文件缓冲区缓冲

 

5.文件的随机读写函数

前面介绍的文件的字符/字符串读写,均是进行文件的顺序读写,即总是从文件的开头开始进行读写。这显然不能满足我们的要求,C语言提供了移动文件指针和随机读写的函数,它们是:

(1).移动文件指针函数

        long ftell(FILE *stream);

        int rewind(FILE *stream);

        fseek(FILE *stream,long offset,intorigin);

 

 函数ftell()用来得到文件指针离文件开头的偏移量。当返回值是-1时表示出错。

rewind()函数用于文件指针移到文件的开头,当移动成功时,返回0,否则返回一个非0值。

fseek()函数用于把文件指针以origin为起点移动offset个字节,其中origin指出的位置可有以下几种:

 

        origin           数值             代表的具体位置

 

SEEK_SET          0               文件开头

SEEK_CUR          1               文件指针当前位置

SEEK_END          2               文件尾

 

例如:

  fseek(fp,10L,0);

 把文件指针从文件开头移到第10字节处,由于offset参数要求是长整型数,故其数后带L。

fseek(fp,-15L,2);

把文件指针从文件尾向前移动15字节。

 

 (2).文件随机读写函数

 

int fread(void*ptr,int size,int nitems,FILE *stream);

int fwrite(void*ptr,int size,int nitems,FILE *stream);

              

fread()函数从流指针指定的文件中读取nitems个数据项,每个数据项的长度为size个字节,读取的nitems数据项存入由ptr指针指向的内存缓冲区中,

在执行fread()函数时,文件指针随着读取的字节数而向后移动,最后移动结束的位置等于实际读出的字节数。该函数执行结束后,将返回实际读出的数据项数,

这个数据项数不一定等于设置的nitems,因为若文件中没有足够的数据项,或读中间出错,都会导致返回的数据项数少于设置的nitems。当返回数不等于nitems时

,可以用feof()或ferror()函数进行检查。

 

fwrite()函数从ptr指向的缓冲区中取出长度为size字节的nitems个数据项,写入到流指针stream指向的文件中,执行该操作后,文件指针将向后移动,

移动的字节数等于写入文件的字节数目。该函数操作完成后,也将返回写入的数据项数。