select源码剖析
来源:互联网 发布:linux中usermod 编辑:程序博客网 时间:2024/05/17 11:59
我左看右看,上看下看,一不小心看懂了select→_→现在就让它现出原形~*
int select(int nfds,fd_set *readfds,fd_set *writefds,fd_set *exceptfds,struct timeval *timeout)
1)nfds参数指定被监听的文件描述符的总数。它通常被设置为select监听的所有的文件描述符中的最大值加1。因为文件描述符是从0开始计数的。
2)readfds,writefds和exceptfds参数分别指向可读、可写和异常等事件对应的文件描述符集合。应用程序调用select函数时,通过这3个参数传入自己感兴趣的文件描述符。select调用返回时,内核将修改它们来通知应用程序哪些文件描述符已经就绪。
//因此fd_set实际上是一个具有32个元素的unsigned long类型的数组typedef struct { unsigned long fds_bits [__FDSET_LONGS];} __kernel_fd_set;typedef __kernel_fd_set fd_set;
fd_set结构体仅包含一个整形数组,该数组的每个元素的每一位标记一个文件描述符。fd_set能容纳的文件描述符数量由FD_SETSIZE指定,这就限制了select能同时处理的文件描述符的总量。
3)timeout参数用来设置select函数的超时时间,如果是0,则select立刻返回。如果是NULL,select将一直阻塞,直到某个文件描述符上有时间发生。
select中重要的数据结构fd_set_bits,poll_table_page,poll_tablle_entry,poll_wqueues。
typedef struct { unsigned long *in, *out, *ex;//要求 unsigned long *res_in, *res_out, *res_ex;//结果} fd_set_bits;
struct poll_wqueues { poll_table pt; struct poll_table_page * table; int error;};
struct poll_table_page { //一个页面用完了就再分配一个,通过next链成一条单链 struct poll_table_page * next; //entry总是指向entries中第一个空闲的poll_table_entry结构,根据需要动态的分配entries中的表项 struct poll_table_entry * entry; //表示该数组可以动态地确定大小,实际使用中分配一个页面,页面中能容纳几个poll_table_entry,这个数组就有多大 struct poll_table_entry entries[0];};
struct poll_table_entry { struct file * filp; wait_queue_t wait;//被封装的wait_queue_t wait_queue_head_t * wait_address;//等待队列的队头};
//提供了6个宏函数,返回要求位图或结果位图中对应的下标元素的值#define __IN(fds, n) (fds->in + n)#define __OUT(fds, n) (fds->out + n)#define __EX(fds, n) (fds->ex + n)#define __RES_IN(fds, n) (fds->res_in + n)#define __RES_OUT(fds, n) (fds->res_out + n)#define __RES_EX(fds, n) (fds->res_ex + n)//这个元素下标可以同时对应三种位图,所以在一个位图中监听存在就行#define BITS(fds, n) (*__IN(fds, n)|*__OUT(fds, n)|*__EX(fds, n))
asmlinkage long sys_select(int n, fd_set __user *inp, fd_set __user *outp, fd_set __user *exp, struct timeval __user *tvp){ fd_set_bits fds; char *bits; long timeout; int ret, size, max_fdset; timeout = MAX_SCHEDULE_TIMEOUT; if (tvp) { time_t sec, usec; //将所需数据从用户空间拷贝到内核空间 if ((ret = verify_area(VERIFY_READ, tvp, sizeof(*tvp))) || (ret = __get_user(sec, &tvp->tv_sec)) || (ret = __get_user(usec, &tvp->tv_usec))) goto out_nofds; ret = -EINVAL; if (sec < 0 || usec < 0) goto out_nofds; if ((unsigned long) sec < MAX_SELECT_SECONDS) { timeout = ROUND_UP(usec, 1000000/HZ); timeout += sec * (unsigned long) HZ; } } ret = -EINVAL; if (n < 0) goto out_nofds; max_fdset = current->files->max_fdset; //判断文件描述符数量有没有超过最大值 if (n > max_fdset) n = max_fdset; ret = -ENOMEM; size = FDS_BYTES(n); //一共分配6个位图 bits = select_bits_alloc(size); //为要求和结果,一共6个位图初始化 if (!bits) goto out_nofds; fds.in = (unsigned long *) bits; fds.out = (unsigned long *) (bits + size); fds.ex = (unsigned long *) (bits + 2*size); fds.res_in = (unsigned long *) (bits + 3*size); fds.res_out = (unsigned long *) (bits + 4*size); fds.res_ex = (unsigned long *) (bits + 5*size); //将3个要求位图从用户空间复制到内核空间中的fds的要求位图 if ((ret = get_fd_set(n, inp, fds.in)) || (ret = get_fd_set(n, outp, fds.out)) || (ret = get_fd_set(n, exp, fds.ex))) goto out; //将内核空间的fds的结果位图初始化为0 zero_fd_set(n, fds.res_in); zero_fd_set(n, fds.res_out); zero_fd_set(n, fds.res_ex); // ret记录就绪事件的总数 ret = do_select(n, &fds, &timeout); //监听用户感兴趣的事件 if (tvp && !(current->personality & STICKY_TIMEOUTS)) { time_t sec = 0, usec = 0; if (timeout) { sec = timeout / HZ; usec = timeout % HZ; usec *= (1000000/HZ); } put_user(sec, &tvp->tv_sec); put_user(usec, &tvp->tv_usec); } if (ret < 0) goto out; if (!ret) { ret = -ERESTARTNOHAND; if (signal_pending(current)) goto out; ret = 0; } //将3个结果位图的内容复制到用户空间中 if (set_fd_set(n, inp, fds.res_in) || set_fd_set(n, outp, fds.res_out) || set_fd_set(n, exp, fds.res_ex)) ret = -EFAULT;out: select_bits_free(bits, size);//释放要求和结果位图的6个位图的空间out_nofds: return ret;//返回就绪事件的总数}
int do_select(int n, fd_set_bits *fds, long *timeout){ struct poll_wqueues table; poll_table *wait; int retval, i; long __timeout = *timeout; spin_lock(¤t->files->file_lock); //计算所监听的文件描述符在位图中的最大的序号是多少,高于这个序号的文件描述符都与本次操作无关 retval = max_select_fd(n, fds); spin_unlock(¤t->files->file_lock); if (retval < 0) return retval; n = retval; //当一个进程要进入睡眠,而想要某个设备的驱动程序在设备的状态发生变化时将其唤醒,就要准备一个wait_queue_t数据结构,并将这个数据结构挂入目标设备的某个等待队列中。而wait_queue_t就封装在poll_table类型结构中 //初始化poll_table类型结构变量,将table成员置为NULL,error成员置为0 //回调函数 poll_initwait(&table); wait = &table.pt; if (!__timeout) wait = NULL; retval = 0; //进入for循环,直到所监听的事件就绪,或指定的睡眠等待时间到期,或者当前进程收到了信号时才会结束 for (;;) { unsigned long *rinp, *routp, *rexp, *inp, *outp, *exp; set_current_state(TASK_INTERRUPTIBLE);//将当前进程的状态置为可中断阻塞,即当前进程将会进入浅睡眠状态 inp = fds->in; outp = fds->out; exp = fds->ex; rinp = fds->res_in; routp = fds->res_out; rexp = fds->res_ex; //内层for循环中,对所要监视的文件描述符对应的位图进行一次扫描 for (i = 0; i < n; ++rinp, ++routp, ++rexp) { unsigned long in, out, ex, all_bits, bit = 1, mask, j; unsigned long res_in = 0, res_out = 0, res_ex = 0; struct file_operations *f_op = NULL; struct file *file = NULL; in = *inp++; out = *outp++; ex = *exp++; all_bits = in | out | ex; if (all_bits == 0) { i += __NFDBITS; continue; } for (j = 0; j < __NFDBITS; ++j, ++i, bit <<= 1) { if (i >= n) break; if (!(bit & all_bits)) continue; file = fget(i); //文件的具体询问方式和其类型有关,即是通过file_operations数据结构中的函数指针poll进行的。 if (file) { if (file) { f_op = file->f_op; mask = DEFAULT_POLLMASK; if (f_op && f_op->poll) mask = (*f_op->poll)(file, retval ? NULL : wait); fput(file); //retval记录一共有几个事件就绪 //将询问的输入结果汇集到fds所指的fd_set_bits变量中 if ((mask & POLLIN_SET) && (in & bit)) { res_in |= bit; retval++; } //将询问的输出结果汇集到fds所指的fd_set_bits变量中 if ((mask & POLLOUT_SET) && (out & bit)) { res_out |= bit; // fd对应的设备可读 retval++; }//将询问的异常结果汇集到fds所指的fd_set_bits变量中 if ((mask & POLLEX_SET) && (ex & bit)) { res_ex |= bit; // fd对应的设备可写 retval++; } } cond_resched(); }// 根据poll的结果写回到输出位图里,返回给上级函数 if (res_in) *rinp = res_in; if (res_out) *routp = res_out; if (res_ex) *rexp = res_ex; } wait = NULL; //对所有的文件描述符进行询问后,检查是否有事件就绪、睡眠等待时间超时、接收到了信号,如果有条件满足,就不会再进入睡眠状态,直接结束大循环 //统计好就绪事件后,此时retval不为0,从break跳出,结束大循环 if (retval || !__timeout || signal_pending(current)) break; //检查是否出错,如果出错,也不会进入睡眠状态,直接结束大循环 if(table.error) { retval = table.error; break; } //进入睡眠状态,被唤醒后再进行一次扫描询问 //除第一次以外,以后都是在进程被唤醒时才执行一遍循环 __timeout = schedule_timeout(__timeout); } __set_current_state(TASK_RUNNING); //设置当前进程的状态为运行态 //将所有进程对应的wait_queue_t结构从各个等待队列中删除 poll_freewait(&table); *timeout = __timeout; return retval;//返回就绪事件的总数}
void poll_freewait(struct poll_wqueues *pwq){ struct poll_table_page * p = pwq->table; //p指向第一个poll_table_page结构,poll_table_page结构由next成员链成单链 //当p不为NULL时,继续循环 while (p) { //entry指向entries中第一个空闲的poll_table_entry结构,entries是一个数组 struct poll_table_entry * entry; struct poll_table_page *old; entry = p->entry; do { entry--; remove_wait_queue(entry->wait_address,&entry->wait);//将entry表示的wait_queue_t结构从等待队列中删除 fput(entry->filp); } while (entry > p->entries);//判断此entries数组中是否还有元素未删除 old = p;//此时poll_table_page结构中的entries数组中已没有元素,此时old记录当前poll_table_page 结构 p = p->next;//p指向下一个poll_table_page 结构 free_page((unsigned long) old);//释放old所指向的poll_table_page结构页面 }}
来来来,上图片→_→*
下一篇总结select、poll、epoll三者的比较~~
阅读全文
0 0
- select源码剖析
- select源码剖析
- select源码剖析
- select源码剖析
- select、epoll源码剖析与对比
- I/O复用--select函数源码剖析
- 《stl源码剖析》剖析
- Orchid select 剖析
- 【源码】ArrayList源码剖析
- 【源码】LinkedList源码剖析
- 【源码】HashMap源码剖析
- 【源码】HashMap源码剖析
- 【源码】Hashtable源码剖析
- 【源码】LinkedHashMap源码剖析
- 【源码】LruCache源码剖析
- 【源码】TreeMap源码剖析
- 【源码】LinkedHashMap源码剖析
- 【源码】LruCache源码剖析
- tensorflow学习——collections.namedtuple函数
- [C++] 继承与同名成员变量
- [C++] 零散知识点
- 银行卡识别OCR开发流程
- Clion this file does not belong to any project target问题解决方案
- select源码剖析
- javascript学习笔记之BOM和DOM详解
- [C++] 前置++和后置++的区别
- unity 通过代码查找一个文件夹下的所有文件
- 【九度OJ】1002:Grading
- 《Redis源码学习笔记》键过期
- appium python-client代码分析(一)
- 设计模式之单例模式
- 添加:TK_FLASH_INFO_AVAILABLE_TRUE的metadata 否则没有手电筒功能