Linux系统编程(1)——文件与I/O之C标准I/O函数与系统调用I/O

来源:互联网 发布:南昌淘宝运营公司 编辑:程序博客网 时间:2024/05/18 23:54

Linux系统的I/O也就是一般所说的低级I/O——操作系统提供的基本IO服务,与os绑定,特定于Linux平台。而标准I/O是ANSI C建立的一个标准I/O模型,是一个标准函数包和stdio.h头文件中的定义,具有一定的可移植性。两者一个显著的不同点在于,标准I/O默认采用了缓冲机制,比如调用fopen函数,不仅打开一个文件,而且建立了一个缓冲区(读写模式下将建立两个缓冲区),还创建了一个包含文件和缓冲区相关数据的数据结构。低级I/O一般没有采用缓冲,需要自己创建缓冲区,不过在Linux系统中,都是有使用称为内核缓冲的技术用于提高效率,读写调用是在内核缓冲区和进程缓冲区之间进行的数据复制。

 

   ANSI C定义了一组高级输入输出函数,成为标准I/O库,为程序员提供了Linux I/O的较高级别的替代。这个库(libc)提供了打开和关闭文件的函数(fopen和fclose)、读和写字节的函数(fread和fwrite)、读和写字符串的函数(fgets和fputs)、以及复杂的格式化I/O函数(printf和scanf)。

    标准I/O库将一个打开的文件模型化为一个流。对于程序员而言一个流就是一个指向FILE类型的结构的指针。类型为FILE的流是对文件描述符和缓冲区的抽象。流的缓冲区的目的和RIO读缓冲区的目的是一样的:就是使开销较高的Linux I/O系统调用的次数尽可能的减少。例如,假如我们有一个程序,反复调用标准I/O的getc函数,每次调用返回文件的下一个字符。当第一次调用getc函数时,库函数通过调用一次read系统调用来填充流缓冲区,然后将缓冲区中的第一个字节返回给应用程序。只要缓冲区中还有未读的字节,接下来对getc函数的调用就能直接从流缓冲区中得到服务,而不必去调用开销较高的Linux I/O系统调用。

    文本流是由一系列行组成的,每一行的结尾是一个换行符。如果系统没有遵循这种模式,则标准库将通过一些措施使得该系统适应这种模式。例如,标准库可以在输入端将回车符和换页符都转换成换行符,而在输出端进行反向转换。

    最简单的输入机制是使用getchar()函数从标准输入中(一般为键盘)一次读取一个字符,getchar函数在每次被调用的时候返回下一个输入字符。若遇到文件结尾,则返回EOF。符号常量EOF在头文件stdio.h中定义为-1,但程序中应该使用EOF来测试文件是否结束,这样才能保证程序同EOF的特定值无关。

 

1.fopen与open

标准I/O使用fopen函数打开一个文件:

[cpp] view plaincopy
  1. FILE* fp=fopen(const char* path,const char*mod)  

其中path是文件名,mod用于指定文件打开的模式的字符串,比如"r","w","w+","a"等等,可以加上字母b用以指定以二进制模式打开(对于Linux系统,只有一种文件类型,因此没有区别),如果成功打开,返回一个FILE文件指针,如果失败返回NULL,这里的文件指针并不是指向实际的文件,而是一个关于文件信息的数据包,其中包括文件使用的缓冲区信息。

 

Linux系统使用open函数用于打开一个文件:

[cpp] view plaincopy
  1. int fd=open(char *name,int how);  


与fopen类似,name表示文件名字符串,而how指定打开的模式:O_RDONLY(只读),O_WRONLY(只写),O_RDWR (可读可写),还有其他模式请man 2 open。成功返回一个正整数称为文件描述符,这与标准I/O显著不同,失败的话返回-1,与标准I/O返回NULL也是不同的。

 

2.fclose与close

与打开文件相对的,标准I/O使用fclose关闭文件,将文件指针传入即可,如果成功关闭,返回0,否则返回EOF

比如:

[cpp] view plaincopy
  1. if(fclose(fp)!=0)   
  2.  printf("Error in closing file");  

 

而Linux使用close用于关闭open打开的文件,与fclose类似,只不过当错误发生时返回的是-1,而不是EOF,成功关闭同样是返回0。C语言用error code来进行错误处理的传统做法。

 

3.读文件,getc,fscanf,fgets和read

标准I/O中进行文件读取可以使用getc,一个字符一个字符的读取,也可以使用gets(读取标准io读入的)、fgets以字符串单位进行读取(读到遇到的第一个换行字符的后面),gets(接受一个参数,文件指针)不判断目标数组是否能够容纳读入的字符,可能导致存储溢出(不建议使用),而fgets使用三个参数:

 char* fgets(char *s, int size, FILE *stream);

第一个参数和gets一样,用于存储输入的地址,第二个参数为整数,表示输入字符串的最大长度,最后一个参数就是文件指针,指向要读取的文件。最后是fscanf,与scanf类似,只不过增加了一个参数用于指定操作的文件,比如fscanf(fp,"%s",words)

 

Linux系统中使用read函数用于读取open函数打开的文件,函数原型如下:

[cpp] view plaincopy
  1. ssize_t numread=read(int fd,void*buf,size_t qty);  


其中fd就是open返回的文件描述符,buf用于存储数据的目的缓冲区,而qty指定要读取的字节数。如果成功读取,就返回读取的字节数目(小于等于qty)。

 

4.判断文件结尾,如果尝试读取达到文件结尾,标准IO的getc会返回特殊值EOF,而fgets碰到EOF会返回NULL,而对于Linux的read函数,情况有所不同。read读取qty指定的字节数,最终读取的数据可能没有你所要求的那么多(qty),而当读到结尾再要读的话,read函数将返回0.

 

5.写文件:putc,fputs,fprintf和write

 

与读文件相对应的,标准C语言I/O使用putc写入字符,比如:

[cpp] view plaincopy
  1. putc(ch,fp);  


第一个参数是字符,第二个是文件指针。而fputs与此类似:

[cpp] view plaincopy
  1. fputs(buf,fp);  


仅仅是第一个参数换成了字符串地址。而fprintf与printf类似,增加了一个参数用于指定写入的文件,比如:

[cpp] view plaincopy
  1. fprintf(stdout,"Hello%s.\n","dennis");  


切记fscanf和fprintf将FILE指针作为第一个参数,而putc,fputs则是作为第二个参数。

 

在系统中提供write函数用于写入文件,原型与read类似:

[cpp] view plaincopy
  1. ssize_t result=write(int fd,void *buf,size_t amt);  


fd是文件描述符,buf是将要写入的内存数据,amt是要写的字节数。如果写入成功返回写入的字节数,通过result与amt的比较可以判断是否写入正常,如果写入失败返回-1。write函数仅仅是将数据写入了缓冲区,何时写入磁盘由内核决定,如果要强制写入硬盘,那么在open的时候选择O_SYNC选项,或者调用fsync函数

 

6.随机存取:fseek()、ftell()和lseek()

标准I/O使用fseek和ftell用于文件的随机存取,先看看fseek函数原型

[cpp] view plaincopy
  1. int fseek(FILE *stream, long offset, intwhence);  


第一个参数是文件指针,第二个参数是一个long类型的偏移量(offset),表示从起始点开始移动的距离。第三个参数就是用于指定起始点的模式,stdio.h指定了下列模式常量:

SEEK_SET            文件开始处

SEEK_CUR            当前位置

SEEK_END            文件结尾处

看几个调用例子:

[cpp] view plaincopy
  1. fseek(fp,0L,SEEK_SET);  //找到文件的开始处  
  2. fseek(fp,0L,SEEK_END);  //定位到文件结尾处  
  3. fseek(fp,2L,SEEK_CUR);  //文件当前位置向前移动2个字节数  
 

而ftell函数用于返回文件的当前位置,返回类型是一个long类型,比如下面的调用:

[cpp] view plaincopy
  1. fseek(fp,0L,SEEK_END);//定位到结尾  
  2. long last=ftell(fp);  //返回当前位置  


那么此时的last就是文件指针fp指向的文件的字节数。

 

与标准I/O类似,Linux系统提供了lseek来完成fseek的功能,原型如下:

[cpp] view plaincopy
  1. off_t lseek(int fildes, off_t offset, intwhence);  


fildes是文件描述符,而offset也是偏移量,whence同样是指定起始点模式,唯一的不同是lseek有返回值,如果成功就返回指针变化前的位置,否则返回-1。因此可以通过下列方法模拟ftell函数来返回当前偏移量:

[cpp] view plaincopy
  1. off_t   currpos;  
  2. currpos = lseek(fd, 0, SEEK_CUR);  


whence的取值与fseek相同:SEEK_SET,SEEK_CUR,SEEK_END,但也可以用整数0,1,2相应代替。

 

最后,以一个例子结尾,通过c语言编写linux系统的cp指令,先看看使用标准I/O版本的:

[cpp] view plaincopy
  1. #include<stdio.h>  
  2. #include<stdlib.h>  
  3. void oops(char *,char *);  
  4. int main(int ac,char *av[])  
  5. {  
  6.  FILE *in,*out;  
  7.   intch;  
  8.    
  9.  if(ac!=3){  
  10.   fprintf(stderr,"Useage:%s source-file target-file.\n",av[0]);  
  11.   exit(1);  
  12.   }  
  13.  if((in=fopen(av[1],"r"))==NULL)  
  14.   oops("can not open ",av[1]);  
  15.  if((out=fopen(av[2],"w"))==NULL)  
  16.   oops("can not open ",av[2]);  
  17.  while((ch=getc(in))!=EOF)  
  18.    putc(ch,out);  
  19.  if(fclose(in)!=0||fclose(out)!=0)  
  20.    oops("can not close files.\n"," ");  
  21.  return 0;  
  22. }  
  23. void oops(char *s1,char* s2)  
  24. {  
  25.  fprintf(stderr,"Error:%s %s\n",s1,s2);  
  26.  exit(1);  
  27. }  

 

再看一个使用Linux io的版本:

[cpp] view plaincopy
  1. #include<unistd.h>  
  2. #include<stdio.h>  
  3. #include<fcntl.h>  
  4.    
  5. #define BUFFERSIZE 4096  
  6. #define COPYMODE 0644  
  7. void oops(char *,char *);  
  8.    
  9. int main(int ac,char *av[])  
  10. {  
  11.   intin_fd,out_fd,n_chars;  
  12.  char buf[BUFFERSIZE];  
  13.  if(ac!=3){  
  14.    fprintf(stderr,"useage:%s source-file target-file.\n",av[0]);  
  15.    exit(1);  
  16.   }  
  17.    
  18.  if((in_fd=open(av[1],O_RDONLY))==-1)  
  19.     oops("Can't open ",av[1]);  
  20.  if((out_fd=creat(av[2],COPYMODE))==-1)  
  21.    oops("Can't open ",av[2]);  
  22.  while((n_chars=read(in_fd,buf,BUFFERSIZE))>0)  
  23.      if(write(out_fd,buf,n_chars)!=n_chars)  
  24.           oops("Write error to ",av[2]);  
  25.  if(n_chars==-1)  
  26.      oops("Read error from ",av[1]);  
  27.  if(close(in_fd)==-1||close(out_fd)==-1)  
  28.    oops("Error closing files","");  
  29.  return 0;  
  30. }  
  31. void oops(char *s1,char *s2)  
  32. {  
  33.  fprintf(stderr,"Error:%s",s1);  
  34.  perror(s2);  
  35.  exit(1);  
  36. }  


显然,在使用Linux i/o的时候,你要更多地关注缓冲问题以提高效率,而stdio则不需要考虑。


出自 http://blog.csdn.net/itcastcpp/article/details/38082035

0 0
原创粉丝点击