Linux 高级IO

来源:互联网 发布:简易电路图绘制软件 编辑:程序博客网 时间:2024/05/20 00:13

非阻塞I/O

系统调用有两类,“低速”系统调用和其他,而低速系统调用可能使进程永远阻塞,例如读某些终端设备文件,文件中并没有数据,读操作可能使调用者永远阻塞。

非阻塞I/O使我们可以的一些操作不会永远的阻塞,如果操作继续执行将会进入阻塞状态,则调用立即出错返回。

比如对于一个给定的描述符,有两种方法指定其为非阻塞I/O:
1. 调用open函数打开文件时指定O_NONBLOCK标志
2. 打开文件后对文件描述符调用fcntl修改文件状态标志,同上。


阻塞 非阻塞 异步特点

  • 阻塞IO的特点就是在IO执行的两个阶段(准备数据和拷贝数据)都被阻塞了

  • 非阻塞IO的特点是用户进程需要不点的主动询问内核数据准备好了没有

  • IO多路复用通过一种机制一个进程能同时等待多个文件描述符,而这些文件描述符(套接字描述符)其中的任意一个进入读就绪状态,select函数就可以返回

  • 异步IO用户进程发起read操作后可以立刻开始去做其他事情,而内核会等待数据准备完成然后拷贝到用户内存,完成后给用户进程发送一个signal告诉它read操作完成


记录锁

当一个进程正在读或者修改文件的某个部分的时候,使用记录锁可以防止其他进程修改同意文件区。

#include <fcntl.h>int fcntl(int fd, int cmd, .../*struct flock flockptr */);/*struct flock {    short l_type;    /* Type of lock: F_RDLCK, F_WRLCK, F_UNLCK */    short l_whence;  /* How to interpret l_start: SEEK_SET, SEEK_CUR, SEEK_END */    off_t l_start;   /* Starting offset for lock */    off_t l_len;     /* Number of bytes to lock */    pid_t l_pid;     /* PID of process blocking our lock (F_GETLK only) */};*/
  • l_type 锁的类型:F_RDLCK(共享读锁),F_WRLCK(独占写锁),F_UNLCK(解锁一个区域)

  • l_whence 设定偏移位置,SEEK_SET, SEEK_CUR, SEEK_END

  • l_start 设定区域起始位置偏移量

  • l_len 设定锁定区域的字节长度

  • l_pid 持有锁的进程ID,仅由F_GETLK返回

读锁可以共享,说明第一个进程对文件上锁为读锁时,其他进程也可以对文件上锁区域获取读锁进行读取操作。假如进程想在读锁的基础上获取写锁则会被阻塞。而如果第一个进程对文件上锁为写锁的话,那么其他进程对文件无论希望获取什么锁都会被阻塞。

写锁例子:

#include<stdio.h> #include<unistd.h> #include<sys/types.h>  #include<sys/stat.h>  #include<fcntl.h>#include<sys/file.h>int main()                                                          {                                                                       int fd = open("test.txt",O_RDWR|O_CREAT,0644);                      if(fd < 0)                                                          {                                                                       printf("open err\n");                                               return -1;                                                      }                                                                   struct flock myflock;                                               myflock.l_type = F_WRLCK;  //独占性写锁 F_RDLCK为共享读锁           myflock.l_whence = SEEK_SET; //偏移位置为文件开头                   myflock.l_start = 0; //指定锁的区域开头                             myflock.l_len = 1024; //指定锁的区域大小                            fcntl(fd, F_SETLKW, &myflock);  //锁文件,锁不上说明有别人上锁,就阻塞等待                                                              printf("get lock\n");                                               myflock.l_type = F_UNLCK; //解锁                                    fcntl(fd, F_SETLKW, &myflock);                                      close(fd);    return 0; }      

I/O多路转接

select函数

在所有POSIX兼容的平台上,select函数使我们可执行I/O多路转接。

#include <sys/select.h>int select(int maxfd, fd_set *restrict readfds, fd_set *restrict writefds, fd_set *restrict exceptfds, struct timeval *restrict tvptr);
  • 第一个参数为最大文件描述符编号值加一

  • 中间三个参数readfds,writefds,exceptfds是指向描述符集的指针,分别为我们关心的可读,可写,处于异常条件的描述符集合

  • 最后一个参数为timeval结构体,指定等待描述符准备好的最大时间,若指定NULL则表示阻塞等待,指定0表示不阻塞立即返回,指定非0值为正常指定时间

select例子

#include<stdio.h>#include<unistd.h>#include<sys/select.h>#include<sys/types.h>#include<fcntl.h>#include<errno.h>#include<string.h>#include<stdlib.h>#define MAXSIZE 1024int main(){    int fd_key, fd_mouse;    char buf[MAXSIZE];    // 为了代码整洁性可读性未加错误判断,并且打开此文件可能要root权限    fd_key = open("/dev/input/event1", O_RDONLY);    fd_mouse = open("/dev/input/mice", O_RDONLY);    // 第一个参数 最大文件描述符+1    int maxfd = fd_key > fd_mouse ? fd_key : fd_mouse;    maxfd++;    printf("%d\n",maxfd);    while(1)    {        fd_set rset;        FD_ZERO(&rset); //将rset所有位置0        FD_SET(fd_key, &rset);        FD_SET(fd_mouse, &rset);        struct timeval tv;        tv.tv_sec = 1; //秒        tv.tv_usec = 0; //微秒        int ret = select(maxfd, &rset, NULL, NULL, &tv);        if(ret < 0)        {            if(errno == EINTR) //被信号中断                continue;            return -1;        }        else if(ret > 0)        {            if(FD_ISSET(fd_key, &rset))            {                //判断是键盘操作                memset(buf, 0, sizeof(buf));                read(fd_key, buf, sizeof(buf));                printf("keyboard event\n");            }            else if(FD_ISSET(fd_mouse, &rset))            {                //判断是鼠标操作                memset(buf, 0, sizeof(buf));                read(fd_mouse, buf, sizeof(buf));                printf("mouse event\n");            }        }    }    close(fd_key);    close(fd_mouse);    return 0;}

epoll函数

在linux的网络编程中,很长的时间都在使用select来做事件触发。在linux新的内核中,有了一种替换它的机制,就是epoll。

#include <sys/epoll.h>int epoll_create(int size);int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);
epoll_create

创建一个epoll句柄,size用来告诉内核这个监听的数目一共多大,但在Linux 2.6.8开始废弃这个参数,但依然要大于0。

当创建好epoll句柄后,它就是会占用一个fd值,在linux下如果查看/proc/进程id/fd/,是能够看到这个fd的,所以在使用完epoll后,必须调用close()关闭,否则可能导致fd被耗尽。

epoll_ctl

epoll的事件注册函数

  • 第一个参数为epoll_create返回值

  • 第二个参数表示动作
    EPOLL_CTL_ADD:注册新的fd到epfd中;
    EPOLL_CTL_MOD:修改已经注册的fd的监听事件;
    EPOLL_CTL_DEL:从epfd中删除一个fd;

  • 第三个参数为需要监听的fd

  • 第四个参数struct epoll_event告诉内核要监听什么事件

typedef union epoll_data {    void *ptr;    int fd;    __uint32_t u32;    __uint64_t u64;} epoll_data_t;struct epoll_event {    __uint32_t events; /* Epoll events */    epoll_data_t data; /* User data variable */};event的取值:EPOLLIN :表示对应的文件描述符可以读(包括对端SOCKET正常关闭);EPOLLOUT:表示对应的文件描述符可以写;EPOLLPRI:表示对应的文件描述符有紧急的数据可读(这里应该表示有带外数据到来);EPOLLERR:表示对应的文件描述符发生错误;EPOLLHUP:表示对应的文件描述符被挂断;EPOLLET: 将EPOLL设为边缘触发(Edge Triggered)模式,这是相对于水平触发(Level Triggered)来说的。EPOLLONESHOT:只监听一次事件,当监听完这次事件之后,如果还需要继续监听这个socket的话,需要再次把这个socket加入到EPOLL队列里
epoll_wait

等待事件的产生,参数events用来从内核得到事件的集合,maxevents告之内核这个events有多大,这个 maxevents的值不能大于创建epoll_create()时的size,参数timeout是超时时间。该函数返回需要处理的事件数目,如返回0表示已超时。


epoll对文件描述符的操作有两种模式:LT和ET。LT模式是默认模式,LT模式与ET模式的区别如下:  LT模式:当epoll_wait检测到描述符事件发生并将此事件通知应用程序,应用程序可以不立即处理该事件。        下次调用epoll_wait时,会再次响应应用程序并通知此事件。  ET模式:当epoll_wait检测到描述符事件发生并将此事件通知应用程序,应用程序必须立即处理该事件。        如果不处理,下次调用epoll_wait时,不会再次响应应用程序并通知此事件。    (对应epoll_ctl内的struct epoll_event结构体中的__uint32_t enents的(ET)EPOLLET模式,默认是LT模式)

select和epoll的区别

  • select出现早,使用位域来表示描述符集合
    其缺点是描述符数量的限制,在Linux上一般为1024,大规模文件通过遍历fdset找到就绪的描述符,效率低。

  • epoll出现晚,使用红黑树来保存文件集合,大规模文件描述符效率高


存储映射I/O

mmap创建映射区见此博文

1 0
原创粉丝点击