文件操作之标准I/O函数库

来源:互联网 发布:python 相似度 编辑:程序博客网 时间:2024/05/20 12:23

三、标准I/O函数库

C标准库提供了文件的标准 I/O函数库,相比前述的系统调用,主要差别是实现了跨平台的用户态缓冲的解决方案。标准I/O库使用简单,与系统调用I/O相似,也包括打开、读写、关闭这些操作。

系统调用是操作系统直接提供的函数接口。因为运行系统调用时,Linux必须从用户态切换到内核态,执行相应的请求,然后再返回到用户态,所以应该尽量减少系统调用的次数,从而提高程序的效率。

1、文件指针和流

系统级的I/O操作函数都是针对文件描述符的。即打开文件时返回一个文件描述符,然后可以直接对该文件描述符进行操作。

对于标准I/O操作函数来说,打开或创建一个文件时,会返回一个指向FILE对象的指针。该FILE对象通常是一个结构体,它包含了I/O函数库为管理该FILE对象所需要的尽可能多的信息。包括用于实际I/O文件的文件描述符,指向流缓存的指针,缓存长度等。

文件指针与文件描述符是一一对应的关系,这种对应关系由标准I/O库自己内部维护。应用程序调用时,只需要提供文件指针即可。文件指针指向的数据类型为FILE型,但应用程序无须关系它的具体内容。

在标准I/O中,一个打开的文件称为流(stream),流可以用于读(输入流)、写(输出流)或者是读写(输入输出流)。每个进程在启动后就会打开三个流,与打开的三个文件相对应:stdin代表标准输入流,stdout代表标准输出流,stderr代表标准错误输出流(与地层文件描述符0,1和2相对应),它们都是(FILE*)型的指针。标准错误输出流不进行缓冲,输出的内容会马上同步到文件(控制台设备)。

2、标准 I/O编程

2.1、打开和关闭流

fopen函数用于打开一个文件流,其原型如下:

FILE *fopen(const char *filename, const char *mode);

 filename:被打开的文件的名称(可包含路径)。
 mode:字符串,用于表示打开的模式。
 返回值:打开成功后的文件指针,失败则返回NULL。

 mode如下:(此参数是一个字符串,而不是一个字符,所以应该使用双引号)

 字符串    含义
 “r” 或 “rb”   以只读方式打开
 “w” 或 “wb”  以只写方式打开,若文件有内容,则清空
 “a” 或 “ab”   以只写方式打开,原内容保留,写入的内容附加在文件流尾部
 “r+” 或 “rb+ "或 "r+b"  以更新方式打开,此时文件可读可写
 “w+” 或 wb+ 或"w+b " 以更新方式打开,文件可读可写,但打开时清空文件内容
 “a+” 或 "ab+ "或 "a+b " 以更新方式打开,文件可读可写,写入的内容附加在文件流尾部

字母b表示文件是一个二进制文件,而不是一个文本文件。

fclose 函数用于关闭文件,其原型如下:

 int fclose(FILE *stream);

 这个函数可以改变 stream参数所代表的文件,如果改变成功则返回 0,否则将返回 EOF 并且设置变量errno 的值以指示错误。
改变前会自动将文件流中的数据写入文件。

2.2、读和写流

一旦打开了流,则可以在三种不同类型的非格式化I/O中进行选择,对其进行读写操作:
(1).每次一个字符的I/O
(2).每次一行的I/O
(3).数据块I/O,数据块I/O操作读或写一定数量的对象,而每个对象具有指定的长度。fread, fwrite函数常用于每次读或写一个结构。

2.3、每次一个字符的I/O

字符输出函数:

int fgetc(FILE *stream);

int getc(FILE *stream);

int getchar(void);

fgetc 函数用于从文件流中读取一个字符,与它功能相同的函数时 getc,其中 stream 参数是要读取的文件流。它们返回值虽然是整型,但实际表示的是读到的字符,只不过进行了类型转换。如果读操作发送错误或者到达文件尾,则返回值是 EOF。
getc 与 fgetc 的区别在于它可能是由宏定义实现的,因此参数可能在宏展开以后被使用多长,如果参数本身是一个表达式就会被多长求值,这种情况在使用中应该避免。
getchar 函数用于从标准输入流读取一个字符,实际上对 getchar的调用完成等价于getc(stdin),它从标准输入里读取下一个字符。

字符输入函数:

int putc(int c, FILE * stream) ;

int fputc(int c, FILE * stream) ;

int putchar(int c) ;

fputc 函数用于向文件流写入一个字符,其原型如下:putc函数与它的功能相同:

c:是要写入的字符,它虽然是整型,但写入时会将其转换为无符号字符型。
stream:要写入的文件指针。
返回值:写入的字符转换成整型后的值,发送错误则返回EOF。

 putc 函数与fputc函数的区别在于它有可能是用宏定义实现的。

 putchar 用于向标准输出写入一个字符,与putc等同:

 putc(c,stdout),把单个字符写到标准输出。

2.4、每次一行的I/O

行输出函数:

char * gets(char *s)

char fgets(char * s, int size, FILE * stream)

 fgets 用于从文件流中读取一行数据:

 s:指向一个缓冲区,用于存放读到的数据。
 size:读取的字节数上限,实际读取的字节数不会超过 size-1。
 stream:要读取的文件指针。
 返回值:等于 s,如果有错误发生或文件结束,则返回 NULL。

 用 fgets函数读取数据时,当读到一个换行符,或者文件结束,或者读取的字节数达到 size-1,则读取操作不再继续,函数返回。fgets 函数还会在读到的数据最后加一个字符 \0,使之变成一个合法的字符串。注意,如果读到换行符,则换行符也在读到数据中。

 gets 函数用于从标准输入读取一行数据,参数 s指向用于存放数据的缓冲区,如果读取成功则返回值就是s,否则返回 NULL。

 gets 是一个不提倡使用的函数,因为它对读入的字节数没有控制,缓冲区是否会溢出完全取决于用户的输入。

行输入函数:

int fputs(const char *str, FILE *fp)

int puts(const char *str)

 fputs 函数用于向文件流写入一个字符串,其原型如下:

 s:要写入的字符串,必须是以 \0结尾的合法字符串。
 stream:要写入的文件指针。
 返回值:非负数表示写入成功,有错误发生则返回 EOF。

 fputs 函数在向文件流写入字符串时,字符串的结束符 \0并不会被写入。
 puts 函数将字符串写入标准输出, 其中 s参数是要写入的字符串,它的返回值的含义与 fputs 函数相同。
 与 fputs 函数不同的是,puts 函数在将字符串写入之后会再写入一个换行符。

2.5、数据块I/O

size_t fread(void * ptr,size_t size,size_t nmemb,FILE * stream)

 fread函数用于从打开的文件流中读数据:

 ptr:指向用于存放读取到的数据的缓冲区。
 size:被读取的数据块的长度。
 nitems:要读取的数据块的个数。
 stream:被读取的文件指针。
 返回值:实际读取到的数据块的个数。

 使用 fread函数需要注意的是,它以数据块(或称记录)为单位进行读取,返回值也是成功读取的数据块的个数,而不是字节数,这个数目有可能比要读取的个数 nitems 少。

size_t fwrite(const void * ptr,size_t size, size_t nmemb, FILE * stream)

 fwrite 函数用于向打开的文件流写入数据:

 ptr:指向存放写入数据的缓冲区。
 size:要写入的数据块的长度。
 nitems:要写入的数据块的个数。
 stream:要写入的文件指针。
 返回值:实际写入的数据块的个数。

 与 fread函数类似,fwrite 函数也是数据块为单位向文件流写入数据的。

2.6、格式化输出

fprintf 是向文件流格式化写入数据的函数,其原型如下:

int fprintf(FILE *stream, const char *format,...);

stream:要写入的文件指针。
format:格式字符串。
可变参数:要写入的数据。
返回值:如果写入成功,则返回格式化后字符串的长度,也就是写入数据的长度,负数表示有错误发生。

常用输出转换符:

 格式符      功能

 %d 或 %i    按有符号十进制格式输出整型参数

 %u         按无符号十进制格式输出无符号整型参数

 %o      按无符号八进制格式输出无符号整型参数

 %x      按无符号十六进制格式输出无符号整型参数,使用字母 a,b,c,d,e,f

 %X      按无符号十六进制方式输出无符号整型参数,使用字母 A,B,C,D,E,F

 %c      将整型参数转换为无符号字符型,并输出为字符

 %f       按十进制格式输出高精度浮点型参数

 %e      按科学计数法格式输出高精度浮点型参数,使用字母 e

 %E      按科学计数法格式输出高精度浮点型参数,使用字母 E

 %g 或 %G     可理解为系统自带选择 %f 或 %e 格式输出

 %p      按十六进制格式输出指针型参数

 %s                  将字符指针型参数视为字符串输出

 因为格式字符串中的符号 %有了特殊的含义,所以要原样输出一个 %,则需要连续写两个 %,即 %%。

 常用输出格式符标志(放在 %的后面):

 字符              作用

 数字 0    当输出数字时,填充 0 而不是空格

 减号 - 修改为左对齐方式,空格填充在右边

 空格  对应正数来说,左边预留一个空格作为符号位

 加号 + 总是在正数左边加上 + 符号,在负数左边加上 - 符号

我们常用的 printf 函数实际上是对 fprintf 函数的包装,它用来向标准输出写入格式的字符串,其原型如下:

int printf(const char *format, ...);

 它比 fprintf函数少一个文件指针参数,因为这个文件指针一定是 stdout。

 与格式化输出相关的还有一个函数 sprintf,它并不是文件 I/O 操作,而是将格式化的字符串输出到一个缓冲区中,原型:

 int sprintf(char *str, const char *format,...);

 其中 str参数就指向用于存放结果的缓冲区。sprintf 函数会在输出字符串的末尾加上结束符 \0。使用这个函数时要注意,str

指向的缓冲区要有足够的大小来容纳生成的字符串,否则就有内存访问越界的问题。很多情况下并不能事先知道结果字符串的长度,这时可

以用下面这个函数:

 int snprintf(char *str, size_t size, constchar *format, ...);

size:限制生成字符串的长度,即写入缓冲区的字节数。如果格式化后的字符串长度等于或大于 size,则只写入前 size-1个字节,然后写入结束符 \0。

返回值:格式化后的字符串长度。

2.7、格式化输入函数

fscanf 可以从文件流以一定的格式读取数据,其原型如下:

 int fscanf(FILE *stream, const char *format, ...);

  stream:要读取的文件指针。

  format:格式字符串。

 可变参数:一般是指针,指向用于存储到的数据流量。

 返回值:成功解析的数据项的个数(不是字节数),失败则返回 EOF

 格式字符串中的字符将与输入流中读到的字符进行匹配,具体来说有以下几种情况。

 空白字符:包括空格、制表、换行等字符,将与输入流中的连续 0个或多个空白字符相匹配,也就是说,一个空白字符可以消 耗多个空白字符。

 普通字符:不想与从输入流读入的字符相同。

 转换符:以符合 %开始的多个字符,这时输入流中读入的字符将按某种格式解析为数据,存入对应的可变参数指向的变量中。

 常用输入转换符:

 转换符           作用

 %d        以十进制格式读入整数,存在整型变量中

 %i         当下一个字符是 0时,以八进制格式读取整数;当下两个字符是 0x 或 0X 时,以十六进制格式读入整数;否则以十进制格式读入整数,存放在整型变量中。

 %u        以十进制格式读入整数,存放在无符号整型变量中

 %o           以八进制格式读入整数,存放在无符号整型变量中

 %x 或 %X       以十六进制格式读入整数,存放在无符号整型变量中

 %f,%g,%e 或 %E   读入浮点数,存放在浮点型变量中

 %s      读入字符串,字符串从下一个非空白字符开始,再遇到一个空白字符或者达到指定的域宽后结束。字符串存放在对应的参数指向的缓冲区中,末尾会自动加上 \0

 %c     读入域宽所指定个数的字符,默认是一个。不跳过开始的空白字符,读入的字符放在对应参数指向的字符数组中,末尾不加 \0

  scanf 函数类似于 fscnaf函数,只不过是从标准输入读取数据,原型:

int scanf(const char *format, ...);

还有一个 sscanf 函数可以从字符串中格式化读取数据,原型:

 int sscanf(const char *str, const char*format, ...);

 其中,str参数就是被读取的字符串

2.7、定位流

 fseek函数的功能是把当前位置设置到offset处,whence参数决定了相对于文件的位置,其原型如下:
 int fseek(FILE *stream, long offset, int whence);
  stream:被操作的文件指针。
  offset:读写位置的偏移量。
  whence:用于指定偏移量的相对启点。
  返回值:0 表示操作成功, -1 表示操作失败并且设置 errno 变量的值为错误码。
  whence 参数的取值及含义:
  SEEK_SET:表示偏移量相对于文件的开头。
  SEEK_CUR:表示偏移量相对于当前的读写位置。
  SEEK_END:表示偏移量相对于文件末尾。
 
 如果要将读写位置移动到文件的开头,还可以使用这个函数:
 void rewind(FILE *stream);

 ftell 函数可以得到文件流的读写位置,其原型:
 long ftell(FILE *stream);
 参数 stream 是文件指针,返回值就是文件流的当前读写位置(相对于文件开头)。

2.8、标准 I/O 错误处理:
 当标准 I/O 操作发送错误时,比如返回 NULL 指针或者 EOF,可以通过读 errno 变量得到错误码。
 更方便的是使用标准 I/O 的错误判断函数,如:
 int ferror(FILE *stream);
 int feof(FILE *stream);
ferror函数检查文件在用各种输入输出函数进行读写时是否出错。返回0表示没有错,否则有错。
feof函数判断文件是否处于文件结束位置,如文件结束返回1,否则返回0。