linux文件操作

来源:互联网 发布:centos安装sftp 编辑:程序博客网 时间:2024/06/02 05:44

linux文件操作

1.  什么是文件?linux如何看待文件?

Linux一点哲学,“一切皆为文件”;在Linux中对目录和设备的操作都等同于对文件的操作,都是使用文件描述符来进行的。

Linux文件可分为:普通文件,目录文件,链接文件,设备文件,管道文件

2.  如何来操作文件?

C库函数的文件操作是独立于具体的操作系统平台的,不管是在DOS、Windows、Linux还是在VxWorks中都是这些函数。

Linux里主要有两种文件操作方式:系统调用、ANSI C文件操作。

(1).Linux系统调用:是指操作系统提供给用户程序调用的一组“特殊”接口,用户程序通过这组“接口”来获得操作系统内核提供的服务。例如,用户可以通过进程控制相关的系统调用来创建进程、实现进程调度、进程管理等。

为什么用户程序不能直接访问系统内核提供的服务呢?

由于在Linux中,为了更好地保护内核空间,将程序的运行空间分为内核空间用户空间(也就是常称的内核态和用户态),它们分别运行在不同的级别上,在逻辑上是相互隔离的。

因此,用户进程在通常情况下不允许访问内核数据,也无法使用内核函数,它们只能在用户空间操作用户数据,调用用户空间的函数。


系统调用并不是直接与程序员进行交互的,它仅仅是一个通过软中断机制向内核提交请求,以获取内核服务的接口。在实际使用中程序员调用的通常是用户编程接口—API

系统命令相对API更高了一层,它实际上一个可执行程序,它的内部引用了用户编程接口(API)来实现相应的功能。


(2).ANSI C文件操作是所有操作系统通用的文件操作方法,它的操作是被缓冲过的,被修改的文件并不会立即反应到磁盘中,它在内存中开辟一个“缓冲区”,为程序中的每一个文件操作所使用,当执行读文件的操作时,从磁盘文件中将数据先读入内存“缓冲区”,装满后再从内存“缓冲区”依次读入接收的数据。


3.  什么是文件描述符?linux内核如何分配描述符?

当打开一个现存文件或创建一个新文件时,内核就向进程返回一个文件描述符;当需要读写文件时,也需要把文件描述符作为参数传递给相应的函数。

文件描述符是一个非负的整数,它是一个索引值,并指向在内核中每个进程打开文件的记录表。

一个进程启动时,都会打开3个文件:标准输入、标准输出和标准出错处理


 

4.  什么是带缓存IO操作?什么是不带缓存IO操作?

不带缓存的I/O对是文件描述符操作,带缓存的I/O是针对的。

标准I/O库就是带缓存的I/O,它由ANSI C标准说明。当然,标准I/O最终都会调用上面的I/O例程。

标准I/O库代替用户处理很多细节,比如缓存分配、以优化长度执行I/O等。

 

不带缓存IO操作:

主要用到6个函数:creat、open、read、write、lseek、close

不带缓存是指每一个函数都只调用系统中的一个函数,这些函数虽然都不是ANSI C的组成部分,但却是POSIX的组成部分。

带缓存IO操作:

标准I/O库提供缓冲的目的是尽可能减少使用read和write调用的次数,它对每个I/O流自动地进行管理,从而避免应用程序需要考虑这一点所带来的麻烦。

三种缓冲:全缓冲、行缓冲、不带缓冲

全缓存。当填满标准I/O缓存后才执行I/O操作。磁盘上的文件通常是全缓存的。

行缓存。当输入输出遇到新行符或缓存满时,才由标准I/O库执行实际I/O操作。stdin、stdout通常是行缓存的。

无缓存。相当于read、write了。stderr通常是无缓存的,因为它必须尽快输出。

 

一般而言,由系统选择缓存的长度,并自动分配。标准I/O库在关闭流的时候自动释放缓存

 在标准I/O库中,一个效率不高的不足之处是需要复制的数据量

当使用每次一行函数fgets和fputs时,通常需要复制两次数据:

       第一次是在内核和标准I/O缓存之间(当调用read和write时)

       第二次是在标准I/O缓存(通常系统分配和管理)和用户程序中的行缓存(fgets的参数就需要一个用户行缓存指针)之间。

 

5.  linux文件操作的模型能否总结出来?

1)       堵塞I/O操作模型:举例说明如果你想从一块缓冲区或内存读数据,但是其中并没有数据,进程就会挂起等待数据准备好,直到数据准备好再进行read操作;

2)       非堵塞I/O操作模型:面对缓存区或内存并无数据的情况,进程不会休眠,而是立即返回,随后以轮询的方式不断检查数据是否准备好,数据准备好后进行读操作;

3)       I/O多路转接模型:较堵塞I/O操作模型多了一个select(),select()代替进程对文件描述符进行循环监听,当描述符准备就绪后,它返回可读条件后再进行I/O操作;

4)       信号驱动I/O模型:应用程序告诉内核,当你准备好数据后,给我发送一个信号,并调用我的信号处理函数获取数据报;

5)       异步I/O模型:不使用read,write系统接口使用aio_read系列的内核接口。内核无数据报准备好,把控制权归还应用程序,有数据报准备好就把数据包传给应用程序,返回给aio_read中定义好的函数处理程序。

0 0