Linux系统编程（1）——文件与I/O之C标准I/O函数与系统调用I/O

来源：互联网发布：南昌淘宝运营公司编辑：程序博客网时间：2024/05/18 23:54

Linux系统的I/O也就是一般所说的低级I/O——操作系统提供的基本IO服务，与os绑定，特定于Linux平台。而标准I/O是ANSI C建立的一个标准I/O模型，是一个标准函数包和stdio.h头文件中的定义，具有一定的可移植性。两者一个显著的不同点在于，标准I/O默认采用了缓冲机制，比如调用fopen函数，不仅打开一个文件，而且建立了一个缓冲区（读写模式下将建立两个缓冲区），还创建了一个包含文件和缓冲区相关数据的数据结构。低级I/O一般没有采用缓冲，需要自己创建缓冲区，不过在Linux系统中，都是有使用称为内核缓冲的技术用于提高效率，读写调用是在内核缓冲区和进程缓冲区之间进行的数据复制。

ANSI C定义了一组高级输入输出函数，成为标准I/O库，为程序员提供了Linux I/O的较高级别的替代。这个库（libc）提供了打开和关闭文件的函数（fopen和fclose）、读和写字节的函数（fread和fwrite）、读和写字符串的函数（fgets和fputs）、以及复杂的格式化I/O函数（printf和scanf）。

标准I/O库将一个打开的文件模型化为一个流。对于程序员而言一个流就是一个指向FILE类型的结构的指针。类型为FILE的流是对文件描述符和缓冲区的抽象。流的缓冲区的目的和RIO读缓冲区的目的是一样的：就是使开销较高的Linux I/O系统调用的次数尽可能的减少。例如，假如我们有一个程序，反复调用标准I/O的getc函数，每次调用返回文件的下一个字符。当第一次调用getc函数时，库函数通过调用一次read系统调用来填充流缓冲区，然后将缓冲区中的第一个字节返回给应用程序。只要缓冲区中还有未读的字节，接下来对getc函数的调用就能直接从流缓冲区中得到服务，而不必去调用开销较高的Linux I/O系统调用。

文本流是由一系列行组成的，每一行的结尾是一个换行符。如果系统没有遵循这种模式，则标准库将通过一些措施使得该系统适应这种模式。例如，标准库可以在输入端将回车符和换页符都转换成换行符，而在输出端进行反向转换。

最简单的输入机制是使用getchar()函数从标准输入中（一般为键盘）一次读取一个字符，getchar函数在每次被调用的时候返回下一个输入字符。若遇到文件结尾，则返回EOF。符号常量EOF在头文件stdio.h中定义为-1，但程序中应该使用EOF来测试文件是否结束，这样才能保证程序同EOF的特定值无关。

1.fopen与open

标准I/O使用fopen函数打开一个文件：

[cpp] view plaincopy
FILE* fp=fopen(const char* path,const char*mod)  

其中path是文件名，mod用于指定文件打开的模式的字符串，比如"r","w","w+","a"等等，可以加上字母b用以指定以二进制模式打开（对于Linux系统，只有一种文件类型，因此没有区别）,如果成功打开，返回一个FILE文件指针，如果失败返回NULL,这里的文件指针并不是指向实际的文件，而是一个关于文件信息的数据包，其中包括文件使用的缓冲区信息。

Linux系统使用open函数用于打开一个文件：

[cpp] view plaincopy
int fd=open(char *name,int how);  

与fopen类似，name表示文件名字符串，而how指定打开的模式：O_RDONLY(只读),O_WRONLY(只写）,O_RDWR （可读可写),还有其他模式请man 2 open。成功返回一个正整数称为文件描述符，这与标准I/O显著不同，失败的话返回-1，与标准I/O返回NULL也是不同的。

2.fclose与close

与打开文件相对的，标准I/O使用fclose关闭文件，将文件指针传入即可，如果成功关闭，返回0，否则返回EOF

比如：

[cpp] view plaincopy
if(fclose(fp)!=0)   
 printf("Error in closing file");  

而Linux使用close用于关闭open打开的文件，与fclose类似，只不过当错误发生时返回的是-1，而不是EOF，成功关闭同样是返回0。C语言用error code来进行错误处理的传统做法。

3.读文件，getc,fscanf,fgets和read

标准I/O中进行文件读取可以使用getc，一个字符一个字符的读取，也可以使用gets（读取标准io读入的）、fgets以字符串单位进行读取（读到遇到的第一个换行字符的后面），gets（接受一个参数，文件指针）不判断目标数组是否能够容纳读入的字符，可能导致存储溢出(不建议使用），而fgets使用三个参数：

char* fgets(char *s, int size, FILE *stream);

第一个参数和gets一样，用于存储输入的地址，第二个参数为整数，表示输入字符串的最大长度，最后一个参数就是文件指针，指向要读取的文件。最后是fscanf，与scanf类似，只不过增加了一个参数用于指定操作的文件，比如fscanf(fp,"%s",words)

Linux系统中使用read函数用于读取open函数打开的文件，函数原型如下：

[cpp] view plaincopy
ssize_t numread=read(int fd,void*buf,size_t qty);  

其中fd就是open返回的文件描述符，buf用于存储数据的目的缓冲区，而qty指定要读取的字节数。如果成功读取，就返回读取的字节数目（小于等于qty）。

4.判断文件结尾，如果尝试读取达到文件结尾，标准IO的getc会返回特殊值EOF，而fgets碰到EOF会返回NULL,而对于Linux的read函数，情况有所不同。read读取qty指定的字节数，最终读取的数据可能没有你所要求的那么多（qty），而当读到结尾再要读的话，read函数将返回0.

5.写文件：putc,fputs,fprintf和write

与读文件相对应的，标准C语言I/O使用putc写入字符，比如：

[cpp] view plaincopy
putc(ch,fp);  

第一个参数是字符，第二个是文件指针。而fputs与此类似：

[cpp] view plaincopy
fputs(buf,fp);  

仅仅是第一个参数换成了字符串地址。而fprintf与printf类似，增加了一个参数用于指定写入的文件，比如：

[cpp] view plaincopy
fprintf(stdout,"Hello%s.\n","dennis");  

切记fscanf和fprintf将FILE指针作为第一个参数，而putc,fputs则是作为第二个参数。

在系统中提供write函数用于写入文件，原型与read类似：

[cpp] view plaincopy
ssize_t result=write(int fd,void *buf,size_t amt);  

fd是文件描述符，buf是将要写入的内存数据，amt是要写的字节数。如果写入成功返回写入的字节数，通过result与amt的比较可以判断是否写入正常，如果写入失败返回-1。write函数仅仅是将数据写入了缓冲区，何时写入磁盘由内核决定，如果要强制写入硬盘，那么在open的时候选择O_SYNC选项，或者调用fsync函数

6.随机存取：fseek()、ftell()和lseek()

标准I/O使用fseek和ftell用于文件的随机存取，先看看fseek函数原型

[cpp] view plaincopy
int fseek(FILE *stream, long offset, intwhence);  

第一个参数是文件指针，第二个参数是一个long类型的偏移量（offset），表示从起始点开始移动的距离。第三个参数就是用于指定起始点的模式，stdio.h指定了下列模式常量：

SEEK_SET 文件开始处

SEEK_CUR 当前位置

SEEK_END 文件结尾处

看几个调用例子：

[cpp] view plaincopy
fseek(fp,0L,SEEK_SET);  //找到文件的开始处  
fseek(fp,0L,SEEK_END);  //定位到文件结尾处  
fseek(fp,2L,SEEK_CUR);  //文件当前位置向前移动2个字节数  

而ftell函数用于返回文件的当前位置，返回类型是一个long类型，比如下面的调用：

[cpp] view plaincopy
fseek(fp,0L,SEEK_END);//定位到结尾  
long last=ftell(fp);  //返回当前位置  

那么此时的last就是文件指针fp指向的文件的字节数。

与标准I/O类似，Linux系统提供了lseek来完成fseek的功能，原型如下：

[cpp] view plaincopy
off_t lseek(int fildes, off_t offset, intwhence);  

fildes是文件描述符，而offset也是偏移量，whence同样是指定起始点模式，唯一的不同是lseek有返回值，如果成功就返回指针变化前的位置，否则返回-1。因此可以通过下列方法模拟ftell函数来返回当前偏移量：

[cpp] view plaincopy
off_t   currpos;  
currpos = lseek(fd, 0, SEEK_CUR);  

whence的取值与fseek相同：SEEK_SET,SEEK_CUR,SEEK_END，但也可以用整数0,1,2相应代替。

最后，以一个例子结尾，通过c语言编写linux系统的cp指令，先看看使用标准I/O版本的：

[cpp] view plaincopy
#include<stdio.h>  
#include<stdlib.h>  
void oops(char *,char *);  
int main(int ac,char *av[])  
{  
 FILE *in,*out;  
  intch;  
   
 if(ac!=3){  
  fprintf(stderr,"Useage:%s source-file target-file.\n",av[0]);  
  exit(1);  
  }  
 if((in=fopen(av[1],"r"))==NULL)  
  oops("can not open ",av[1]);  
 if((out=fopen(av[2],"w"))==NULL)  
  oops("can not open ",av[2]);  
 while((ch=getc(in))!=EOF)  
   putc(ch,out);  
 if(fclose(in)!=0||fclose(out)!=0)  
   oops("can not close files.\n"," ");  
 return 0;  
}  
void oops(char *s1,char* s2)  
{  
 fprintf(stderr,"Error:%s %s\n",s1,s2);  
 exit(1);  
}  

再看一个使用Linux io的版本：

[cpp] view plaincopy
#include<unistd.h>  
#include<stdio.h>  
#include<fcntl.h>  
   
#define BUFFERSIZE 4096  
#define COPYMODE 0644  
void oops(char *,char *);  
   
int main(int ac,char *av[])  
{  
  intin_fd,out_fd,n_chars;  
 char buf[BUFFERSIZE];  
 if(ac!=3){  
   fprintf(stderr,"useage:%s source-file target-file.\n",av[0]);  
   exit(1);  
  }  
   
 if((in_fd=open(av[1],O_RDONLY))==-1)  
    oops("Can't open ",av[1]);  
 if((out_fd=creat(av[2],COPYMODE))==-1)  
   oops("Can't open ",av[2]);  
 while((n_chars=read(in_fd,buf,BUFFERSIZE))>0)  
     if(write(out_fd,buf,n_chars)!=n_chars)  
          oops("Write error to ",av[2]);  
 if(n_chars==-1)  
     oops("Read error from ",av[1]);  
 if(close(in_fd)==-1||close(out_fd)==-1)  
   oops("Error closing files","");  
 return 0;  
}  
void oops(char *s1,char *s2)  
{  
 fprintf(stderr,"Error:%s",s1);  
 perror(s2);  
 exit(1);  
}  

显然，在使用Linux i/o的时候，你要更多地关注缓冲问题以提高效率，而stdio则不需要考虑。

出自 http://blog.csdn.net/itcastcpp/article/details/38082035

0 0