Linux下的I/O复用与epoll详解(重点)
来源:互联网 发布:好用的乳液推荐知乎 编辑:程序博客网 时间:2024/06/14 06:42
前言
I/O多路复用有很多种实现。在linux上,2.4内核前主要是select和poll,自Linux 2.6内核正式引入epoll以来,epoll已经成为了目前实现高性能网络服务器的必备技术。尽管他们的使用方法不尽相同,但是本质上却没有什么区别。本文将重点探讨将放在EPOLL的实现与使用详解。
为什么会是EPOLL
select的缺陷
![](http://images.cnblogs.com/OutliningIndicators/ExpandedBlockStart.gif)
1 /linux/posix_types.h:2 3 #define __FD_SETSIZE 1024
图 1.主流I/O复用机制的benchmark
epoll高效的奥秘
epoll精巧的使用了3个方法来实现select方法要做的事:
- 新建epoll描述符==epoll_create()
- epoll_ctrl(epoll描述符,添加或者删除所有待监控的连接)
- 返回的活跃连接 ==epoll_wait( epoll描述符 )
要深刻理解epoll,首先得了解epoll的三大关键要素:mmap、红黑树、链表。
epoll是通过内核与用户空间mmap同一块内存实现的。mmap将用户空间的一块地址和内核空间的一块地址同时映射到相同的一块物理内存地址(不管是用户空间还是内核空间都是虚拟地址,最终要通过地址映射映射到物理地址),使得这块物理内存对内核和对用户均可见,减少用户态和内核态之间的数据交换。内核可以直接看到epoll监听的句柄,效率高。
红黑树将存储epoll所监听的套接字。上面mmap出来的内存如何保存epoll所监听的套接字,必然也得有一套数据结构,epoll在实现上采用红黑树去存储所有套接字,当添加或者删除一个套接字时(epoll_ctl),都在红黑树上去处理,红黑树本身插入和删除性能比较好,时间复杂度O(logN)。
下面几个关键数据结构的定义
![](http://images.cnblogs.com/OutliningIndicators/ExpandedBlockStart.gif)
1 struct epitem 2 { 3 struct rb_node rbn; //用于主结构管理的红黑树 4 struct list_head rdllink; //事件就绪队列 5 struct epitem *next; //用于主结构体中的链表 6 struct epoll_filefd ffd; //每个fd生成的一个结构 7 int nwait; 8 struct list_head pwqlist; //poll等待队列 9 struct eventpoll *ep; //该项属于哪个主结构体10 struct list_head fllink; //链接fd对应的file链表11 struct epoll_event event; //注册的感兴趣的事件,也就是用户空间的epoll_event12 }
![](http://images.cnblogs.com/OutliningIndicators/ExpandedBlockStart.gif)
1 struct eventpoll 2 { 3 spin_lock_t lock; //对本数据结构的访问 4 struct mutex mtx; //防止使用时被删除 5 wait_queue_head_t wq; //sys_epoll_wait() 使用的等待队列 6 wait_queue_head_t poll_wait; //file->poll()使用的等待队列 7 struct list_head rdllist; //事件满足条件的链表 8 struct rb_root rbr; //用于管理所有fd的红黑树 9 struct epitem *ovflist; //将事件到达的fd进行链接起来发送至用户空间10 }
添加以及返回事件
通过epoll_ctl函数添加进来的事件都会被放在红黑树的某个节点内,所以,重复添加是没有用的。当把事件添加进来的时候时候会完成关键的一步,那就是该事件都会与相应的设备(网卡)驱动程序建立回调关系,当相应的事件发生后,就会调用这个回调函数,该回调函数在内核中被称为:ep_poll_callback,这个回调函数其实就所把这个事件添加到rdllist这个双向链表中。一旦有事件发生,epoll就会将该事件添加到双向链表中。那么当我们调用epoll_wait时,epoll_wait只需要检查rdlist双向链表中是否有存在注册的事件,效率非常可观。这里也需要将发生了的事件复制到用户态内存中即可。
epoll_wait的工作流程:
- epoll_wait调用ep_poll,当rdlist为空(无就绪fd)时挂起当前进程,直到rdlist不空时进程才被唤醒。
- 文件fd状态改变(buffer由不可读变为可读或由不可写变为可写),导致相应fd上的回调函数ep_poll_callback()被调用。
- ep_poll_callback将相应fd对应epitem加入rdlist,导致rdlist不空,进程被唤醒,epoll_wait得以继续执行。
- ep_events_transfer函数将rdlist中的epitem拷贝到txlist中,并将rdlist清空。
- ep_send_events函数(很关键),它扫描txlist中的每个epitem,调用其关联fd对用的poll方法。此时对poll的调用仅仅是取得fd上较新的events(防止之前events被更新),之后将取得的events和相应的fd发送到用户空间(封装在struct epoll_event,从epoll_wait返回)。
小结
行文至此,想必各位都应该已经明了为什么epoll会成为Linux平台下实现高性能网络服务器的首选I/O复用调用。
需要注意的是:epoll并不是在所有的应用场景都会比select和poll高很多。尤其是当活动连接比较多的时候,回调函数被触发得过于频繁的时候,epoll的效率也会受到显著影响!所以,epoll特别适用于连接数量多,但活动连接较少的情况。
http://www.cnblogs.com/lojunren/p/3856290.html
- Linux下的I/O复用与epoll详解(重点)
- Linux下的I/O复用与epoll详解
- Linux下的I/O复用与epoll详解
- Linux下的I/O复用与epoll详解
- Linux下的I/O复用与epoll详解
- Linux下的I/O复用与epoll详解
- Linux下的I/O复用与epoll详解
- Linux下的I/O复用与epoll详解
- Linux下的I/O复用与epoll详解
- Linux下的I/O复用与epoll详解 - junren
- Linux下的I/O多路复用select,poll,epoll浅析
- Linux下的I/O多路复用select,poll,epoll浅析
- linux下select,poll,epoll的使用与重点分析
- Linux网络编程16——I/O复用之epoll详解
- Linux网络编程---I/O复用模型之epoll
- linux系统I/O复用技术之三:epoll()
- I/O复用之epoll的ET模式
- I/O复用的系统调用select、poll、epoll
- sql server-Convert DateTime 格式的转换
- JS实现子窗口传值到父窗口
- ThreadPool.QueueUserWorkItem性能测试与提高
- Mysql 查看连接数,状态
- 深入浅出 - Android系统移植与平台开发(十二)- Android JNI机制
- Linux下的I/O复用与epoll详解(重点)
- Path之玩出花样(PathMeasure)
- 1、Spring boot 体验第一篇 simple demo one
- android下使用gdb 调试方法
- Resharper Color identifiers颜色显示异常解决
- uncaught syntaxerror unexpected identifier
- C# DllImport 系统调用使用详解 托管代码的介绍 EntryPoint的使用
- 10个经典的 Java main 方法面试题
- 三种方法计算黄金分割数-java代码