linux网络编程之用select函数实现io复用(基于TCP)引发的思考

来源:互联网 发布:安卓手机仿windows桌面 编辑:程序博客网 时间:2024/05/01 10:02

1、基本概念


   IO多路复用是指内核一旦发现进程指定的一个或者多个IO条件准备读取,它就通知该进程。IO多路复用适用如下场合:
  (1)当客户处理多个描述字时(一般是交互式输入和网络套接口),必须使用I/O复用。
  (2)当一个客户同时处理多个套接口时,而这种情况是可能的,但很少出现。
  (3)如果一个TCP服务器既要处理监听套接口,又要处理已连接套接口,一般也要用到I/O复用。
  (4)如果一个服务器即要处理TCP,又要处理UDP,一般要使用I/O复用。
  (5)如果一个服务器要处理多个服务或多个协议,一般要使用I/O复用。

  与多进程和多线程技术相比,I/O多路复用技术的最大优势是系统开销小,系统不必创建进程/线程,也不必维护这些进程/线程,从而大大减小了系统的开销。



2、select函数


该函数准许进程指示内核等待多个事件中的任何一个发送,并只在有一个或多个事件发生或经历一段指定的时间后才唤醒。函数原型如下:
#include <sys/select.h>#include <sys/time.h>int select(int maxfdp1,fd_set *readset,fd_set *writeset,fd_set *exceptset,const struct timeval *timeout)

返回值:就绪描述符的数目,超时返回0,出错返回-1

函数参数介绍如下:

(1)第一个参数maxfdp1指定待测试的描述字个数,它的值是待测试的最大描述字加1(因此把该参数命名为maxfdp1),描述字0、1、2...maxfdp1-1均将被测试。

因为文件描述符是从0开始的。

(2)中间的三个参数readset、writeset和exceptset指定我们要让内核测试读、写和异常条件的描述字。如果对某一个的条件不感兴趣,就可以把它设为空指针。struct fd_set可以理解为一个集合,这个集合中存放的是文件描述符,可通过以下四个宏进行设置:

          void FD_ZERO(fd_set *fdset);           //清空集合          void FD_SET(int fd, fd_set *fdset);   //将一个给定的文件描述符加入集合之中          void FD_CLR(int fd, fd_set *fdset);   //将一个给定的文件描述符从集合中删除          int FD_ISSET(int fd, fd_set *fdset);   // 检查集合中指定的文件描述符是否可以读写 



一定要注意:FD_ISSET函数,并不是判断fd是不是在fdset集合里面,理解如下

判断描述符fd是否在给定的描述符集fdset中,通常配合select函数使用,由于select函数成功返回时会将未准备好的描述符位清零。通常我们使用FD_ISSET是为了检查在select函数返回后,某个描述符是否准备好,以便进行接下来的处理操作。
当描述符fd在描述符集fdset中返回非零值,否则,返回零。



(3)timeout告知内核等待所指定描述字中的任何一个就绪可花多少时间。其timeval结构用于指定这段时间的秒数和微秒数。
         struct timeval{                   long tv_sec;   //seconds                   long tv_usec;  //microseconds       };


这个参数有三种可能:

(1)永远等待下去:仅在有一个描述字准备好I/O时才返回。为此,把该参数设置为空指针NULL。
(2)等待一段固定时间:在有一个描述字准备好I/O时返回,但是不超过由该参数所指向的timeval结构中指定的秒数和微秒数。

(3)根本不等待:检查描述字后立即返回,这称为轮询。为此,该参数必须指向一个timeval结构,而且其中的定时器值必须为0。



3、 原理图:



4、服务端代码

        实现服务端的并发,客户端想服务端发消息,然后服务端把收到的消息再会给客户端。

        tcp_select.c文件如下

#include <stdio.h>#include <stdlib.h>#include <string.h>#include <errno.h>#include <netinet/in.h>#include <sys/socket.h>#include <sys/select.h>#include <sys/types.h>#include <arpa/inet.h>#include <unistd.h>#include <assert.h>#define IPADDR "127.0.0.1"#define PORT 8888#define MAXLINE 1024#define LISTENQ 5#define SIZE 100typedef struct server_context_st{    int cli_cnt;//客户端个数    int clifds[SIZE];//客户端的个数    fd_set allfds;//句柄集合    int maxfd;//句柄最大值 } server_context_st;static server_context_st *s_srv_ctx = NULL;//初始化服务端contxtstatic int server_init(){    s_srv_ctx = (struct server_context_st*)malloc(sizeof(server_context_st));    if (s_srv_ctx == NULL) {       return -1;    }    memset(s_srv_ctx, 0, sizeof(server_context_st));    for (int i = 0; i < SIZE; i++) {       s_srv_ctx->clifds[i] = -1;    }    return 0;}int create_server_proc(const char* ip, int port){    int fd;    struct sockaddr_in server_addr;    fd = socket(AF_INET, SOCK_STREAM, 0);    if (fd == -1) {       fprintf(stderr, "create socket fail, errno:%d, reason:%s\n", errno, strerror(errno));       return -1;    }    //一个端口释放后会等待2分钟才能再次被使用,SO_REUSEADDR是让端口释放后立即可以被再次使用    int reuse  = 1;    if (setsockopt(fd, SOL_SOCKET, SO_REUSEADDR, &reuse, sizeof(reuse)) == -1) {       return -1;    }     bzero(&server_addr, sizeof(struct sockaddr_in));    server_addr.sin_family  = AF_INET;    inet_pton(AF_INET, ip, &server_addr.sin_addr);    server_addr.sin_port = htons(port);        if (bind(fd, (struct sockaddr*)&server_addr, sizeof(server_addr)) == -1) {        perror("bind error:");        return -1;    }     listen(fd, LISTENQ);    return fd;}static int accept_client_proc(int srvfd){    struct sockaddr_in cliaddr;    socklen_t cliaddrlen;    cliaddrlen = sizeof(cliaddr);    int clifd = -1;    puts("accept client proc is call");ACCEPT:    clifd = accept(srvfd, (struct sockaddr*)&cliaddr, &cliaddrlen);    if (clifd == -1) {        if (errno == EINTR) {           goto ACCEPT;        } else {           fprintf(stderr, "accept fail error:%s\n", strerror(errno));           return -1;        }    }      fprintf(stdout, "accept a new client %s:%d\n", inet_ntoa(cliaddr.sin_addr), cliaddr.sin_port);        //将新的连接描述符添加到数组中    int i = 0;    for(i = 0; i < SIZE; i++) {       if (s_srv_ctx->clifds[i] < 0) {           s_srv_ctx->clifds[i] = clifd;           s_srv_ctx->cli_cnt++;           break;       }    }        if (i == SIZE) {       fprintf(stderr, "too many clients\n");       return -1;    }} static int handle_client_msg(int fd, char* buf){   assert(buf);   printf("recv buf is %s\n", buf);   write(fd, buf, strlen(buf) + 1);   return 0;}static void recv_client_msg(fd_set *readfds){   int i = 0, n = 0;   int clifd;   char buf[MAXLINE] = {0};   for (i = 0; i <= s_srv_ctx->cli_cnt; i++) {       clifd = s_srv_ctx->clifds[i];       if (clifd < 0) {           continue;       }       //判断客户端套接字是否有数据       if (FD_ISSET(clifd, readfds)) {          //接收客户端消息          n = read(clifd, buf, MAXLINE);          if (n <= 0) {             // n == 0表示读取完才,客户都关闭套接字             FD_CLR(clifd, &s_srv_ctx->allfds);             close(clifd);             s_srv_ctx->clifds[i] = -1;             continue;          }          handle_client_msg(clifd, buf);       }   }}//开始接收并且处理客户端的请求static void handle_client_proc(int srvfd){   int clifd = -1;   int retval = 0;   fd_set *readfds = &s_srv_ctx->allfds;   struct timeval tv;   int i = 0;   while (1) {       //每次调用select前都要重新设置文件描述符和时间,因为事件发生之后,文件描述符和时间都被内核修改       FD_ZERO(readfds);       FD_SET(srvfd, readfds);       s_srv_ctx->maxfd = srvfd;              tv.tv_sec = 30;       tv.tv_usec = 0;       //添加客户端套接字       for (i = 0; i < s_srv_ctx->cli_cnt; i++) {           clifd = s_srv_ctx->clifds[i];           //去除无效的客户端句柄            if (clifd != -1) {         FD_SET(clifd, readfds);      }            s_srv_ctx->maxfd = (clifd > s_srv_ctx->maxfd ? clifd : s_srv_ctx->maxfd);       }              //开始轮询接收处理服务端和客户端套接字        retval = select(s_srv_ctx->maxfd + 1, readfds, NULL, NULL, &tv);       if (retval == -1) {   fprintf(stderr, "select error %s\n", strerror(errno));  return;       }             if (retval == 0) {          fprintf(stdout, "select is timeout\n");          continue;       }       if (FD_ISSET(srvfd, readfds))        {           //监听客户端请求           accept_client_proc(srvfd);       } else {           //接受处理客户端的消息           recv_client_msg(readfds);      }   } }static void server_uninit(){    if (s_srv_ctx) {       free(s_srv_ctx);    }     s_srv_ctx = NULL;}int main(){    int srvfd;    //初始化服务端contxt    if (server_init() < 0)    {       return -1;    }     //创建服务,开始监听    srvfd = create_server_proc(IPADDR, PORT);    if (srvfd < 0)    {       fprintf(stderr, "socket create or bind failed\n");       goto error;    }    //开始接收并处理客户端请求    handle_client_proc(srvfd);    server_uninit();    return 0;error:    server_uninit();    return -1;}



5、客户端代码

        tcp_select_client.c文件如下

#include <netinet/in.h>#include <arpa/inet.h>#include <sys/socket.h>#include <stdio.h>#include <string.h>#include <stdlib.h>#include <sys/select.h>#include <time.h>#include <unistd.h>#include <sys/types.h>#include <errno.h>#define MAXLINE 1024#define IPADDRESS "127.0.0.1"#define SERV_PORT 8888#define max(a,b) (a > b) ? a : bstatic void handle_recv_msg(int sockfd, char *buf) {printf("client recv msg is:%s\n", buf);sleep(5);write(sockfd, buf, strlen(buf) +1);}static void handle_connection(int sockfd){char sendline[MAXLINE],recvline[MAXLINE];int maxfdp,stdineof;fd_set readfds;int n;struct timeval tv;int retval = 0;while (1) {FD_ZERO(&readfds);FD_SET(sockfd,&readfds);maxfdp = sockfd;tv.tv_sec = 5;tv.tv_usec = 0;retval = select(maxfdp+1,&readfds,NULL,NULL,&tv);if (retval == -1) {return ;}if (retval == 0) {printf("client timeout.\n");continue;}if (FD_ISSET(sockfd, &readfds)) {n = read(sockfd,recvline,MAXLINE);if (n <= 0) {fprintf(stderr,"client: server is closed.\n");close(sockfd);FD_CLR(sockfd,&readfds);return;}handle_recv_msg(sockfd, recvline);} }}int main(int argc,char *argv[]){int sockfd;struct sockaddr_in servaddr;sockfd = socket(AF_INET,SOCK_STREAM,0);bzero(&servaddr,sizeof(servaddr));servaddr.sin_family = AF_INET;servaddr.sin_port = htons(SERV_PORT);inet_pton(AF_INET,IPADDRESS,&servaddr.sin_addr);int retval = 0;retval = connect(sockfd,(struct sockaddr*)&servaddr,sizeof(servaddr));if (retval < 0) {fprintf(stderr, "connect fail,error:%s\n", strerror(errno));return -1;}printf("client send to server .\n");write(sockfd, "hello server", 32);handle_connection(sockfd);return 0;}


6、运行结果




7、FD_ISSET函数的迷惑和总结

         

   while (1) {       //每次调用select前都要重新设置文件描述符和时间,因为事件发生之后,文件描述符和时间都被内核修改       FD_ZERO(readfds);       FD_SET(srvfd, readfds);       s_srv_ctx->maxfd = srvfd;              tv.tv_sec = 30;       tv.tv_usec = 0;       //添加客户端套接字       for (i = 0; i < s_srv_ctx->cli_cnt; i++) {           clifd = s_srv_ctx->clifds[i];           //去除无效的客户端句柄            if (clifd != -1) {         FD_SET(clifd, readfds);      }            s_srv_ctx->maxfd = (clifd > s_srv_ctx->maxfd ? clifd : s_srv_ctx->maxfd);       }              //开始轮询接收处理服务端和客户端套接字        retval = select(s_srv_ctx->maxfd + 1, readfds, NULL, NULL, &tv);       if (retval == -1) {   fprintf(stderr, "select error %s\n", strerror(errno));  return;       }             if (retval == 0) {          fprintf(stdout, "select is timeout\n");          continue;       }       if (FD_ISSET(srvfd, readfds))        {           //监听客户端请求           accept_client_proc(srvfd);       } else {           //接受处理客户端的消息           recv_client_msg(readfds);      }   } 
一开始,很明显

 FD_SET(srvfd, readfds);
然后select函数挂起,如果有事件发生就触发了select函数,然后进行判断

if (FD_ISSET(srvfd, readfds)) 
刚才才把srvfd加到readds里面去,现在判断是不是在里面,肯定在呀,那程序怎么进入else里面呢?这不日了狗吗?一直不理解,日了狗,后面再群里面问了也不是太懂,可能自己计算机资质太差了,然后吃完饭问搞服务端的人,才搞明白。

我们先看下函数FD_ISSET函数解释

一定要注意:FD_ISSET函数,并不是判断fd是不是在fdset集合里面,理解如下

判断描述符fd是否在给定的描述符集fdset中,通常配合select函数使用,由于select函数成功返回时会将未准备好的描述符位清零。通常我们使用FD_ISSET是为了检查在select函数返回后,某个描述符是否准备好,以便进行接下来的处理操作。
当描述符fd在描述符集fdset中返回非零值,否则,返回零。

当第一个客户端第一次执行Connect的函数的时候会调用select函数,然后这是时候srvfd,准备就绪,设置为1,所以FD_ISSET函数大于0,所以会执行accept_client_proc函数,这个时候服务端得到客户端的fd,也就是clifd,因为执行TCP三次握手之后,客户端再次发消息,这个时候客户端和服务端通信也就是服务端新的clifd通信,当客户端发消息的时候,srvfd基本上就被遗弃了,没有准备好,会把srvfd清0,所以这个时候执行FD_ISSET函数的话,程序会跑到else里面去,也就是执行recv_client_msg函数,好了,终于搞懂了,不知道理解有没有错,明天再学习poll epoll来实现io复用。


select目前几乎在所有的平台上支持,其良好跨平台支持也是它的一个优点。select的一 个缺点在于单个进程能够监视的文件描述符的数量存在最大限制,在Linux上一般为1024,可以通过修改宏定义甚至重新编译内核的方式提升这一限制,但 是这样也会造成效率的降低。

0 0