Socket超时设置---select()的妙用

来源:互联网 发布:js 上传与下载文件 编辑:程序博客网 时间:2024/06/05 12:39

Socket超时设置---select()的妙用

用过 WinSock API 网友们知道:WinSock 编程中有一很方便的地方便是其 
息驱动机制,不管是底层 API 的 WSAAsyncSelect() 还是 MFC 的异步Socket类: 
CAsyncSocket,都提供了诸如 FD_ACCEPT、FD_READ、FD_CLOSE 之类的消息 
供编程人员捕捉并处理。FD_ACCEPT 通知进程有客户方Socket请求连接, 
FD_READ通知进程本地Socket有东东可读,FD_CLOSE通知进程对方Socket已 
关闭。那么,BSD Socket 是不是真的相形见拙呢? 
 
非也! 'cause cpu love unix so. 
 
BSD UNIX中有一系统调用芳名select()完全可以提供类似的消息驱动机制。 
cpu郑重宣布:WinSock的WSAAsyncSeclet()不过是此select()的fork版! 
 
bill也是fork出来的嘛,xixi. 
 
select()的机制中提供一fd_set的数据结构,实际上是一long类型的数组, 
每一个数组元素都能与一打开的文件句柄(不管是Socket句柄,还是其他 
文件或命名管道或设备句柄)建立联系,建立联系的工作由程序员完成, 
当调用select()时,由内核根据IO状态修改fd_set的内容,由此来通知执 
行了select()的进程哪一Socket或文件可读,下面具体解释: 
 
#include  <sys/types.h> 
#include  <sys/times.h> 
#include  <sys/select.h> 
 
int select(nfds, readfds, writefds, exceptfds, timeout) 
int nfds; 
fd_set *readfds, *writefds, *exceptfds; 
struct timeval *timeout; 
 
ndfs:select监视的文件句柄数,视进程中打开的文件数而定,一般设为呢要监视各文件 
      中的最大文件号加一。 
readfds:select监视的可读文件句柄集合。 
writefds: select监视的可写文件句柄集合。 
exceptfds:select监视的异常文件句柄集合。 
timeout:本次select()的超时结束时间。(见/usr/sys/select.h, 
        可精确至百万分之一秒!) 
 
当readfds或writefds中映象的文件可读或可写或超时,本次select() 
就结束返回。程序员利用一组系统提供的宏在select()结束时便可判 
断哪一文件可读或可写。对Socket编程特别有用的就是readfds。 
几只相关的宏解释如下: 
 
FD_ZERO(fd_set *fdset):清空fdset与所有文件句柄的联系。 
FD_SET(int fd, fd_set *fdset):建立文件句柄fd与fdset的联系。 
FD_CLR(int fd, fd_set *fdset):清除文件句柄fd与fdset的联系。 
FD_ISSET(int fd, fdset *fdset):检查fdset联系的文件句柄fd是否 
                                可读写,>0表示可读写。 
(关于fd_set及相关宏的定义见/usr/include/sys/types.h) 
 
这样,你的socket只需在有东东读的时候才读入,大致如下: 
 
... 
int     sockfd; 
fd_set  fdR; 
struct  timeval timeout = ..; 
... 
for(;;) { 
        FD_ZERO(&fdR); 
        FD_SET(sockfd, &fdR); 
        switch (select(sockfd + 1, &fdR, NULL, &timeout)) { 
                case -1: 
                        error handled by u; 
                case 0: 
                        timeout hanled by u; 
                default: 
                        if (FD_ISSET(sockfd)) { 
                                now u read or recv something; 
                                /* if sockfd is father and  
                                server socket, u can now 
                                accept() */ 
                        } 
        } 

 
所以一个FD_ISSET(sockfd)就相当通知了sockfd可读。 
至于struct timeval在此的功能,请man select。不同的timeval设置 
使使select()表现出超时结束、无超时阻塞和轮询三种特性。由于 
timeval可精确至百万分之一秒,所以Windows的SetTimer()根本不算 
什么。你可以用select()做一个超级时钟。 
 
FD_ACCEPT的实现?依然如上,因为客户方socket请求连接时,会发送 
连接请求报文,此时select()当然会结束,FD_ISSET(sockfd)当然大 
于零,因为有报文可读嘛!至于这方面的应用,主要在于服务方的父 
Socket,你若不喜欢主动accept(),可改为如上机制来accept()。 
 
至于FD_CLOSE的实现及处理,颇费了一堆cpu处理时间,未完待续。 
 
-- 
讨论关于利用select()检测对方Socket关闭的问题: 
 
仍然是本地Socket有东东可读,因为对方Socket关闭时,会发一个关闭连接 
通知报文,会马上被select()检测到的。关于TCP的连接(三次握手)和关 
闭(二次握手)机制,敬请参考有关TCP/IP的书籍。 
 
不知是什么原因,UNIX好象没有提供通知进程关于Socket或Pipe对方关闭的 
信号,也可能是cpu所知有限。总之,当对方关闭,一执行recv()或read(), 
马上回返回-1,此时全局变量errno的值是115,相应的sys_errlist[errno] 
为"Connect refused"(请参考/usr/include/sys/errno.h)。所以,在上 
篇的for(;;)...select()程序块中,当有东西可读时,一定要检查recv()或 
read()的返回值,返回-1时要作出关断本地Socket的处理,否则select()会 
一直认为有东西读,其结果曾几令cpu伤心欲断针脚。不信你可以试试:不检 
查recv()返回结果,且将收到的东东(实际没收到)写至标准输出... 
在有名管道的编程中也有类似问题出现。具体处理详见拙作:发布一个有用 
的Socket客户方原码。 
 
至于主动写Socket时对方突然关闭的处理则可以简单地捕捉信号SIGPIPE并作 
出相应关断本地Socket等等的处理。SIGPIPE的解释是:写入无读者方的管道。 
在此不作赘述,请详man signal。 
 
以上是cpu在作tcp/ip数据传输实验积累的经验,若有错漏,请狂炮击之。 
 
唉,昨天在hacker区被一帮孙子轰得差点儿没短路。ren cpu(奔腾的心) z80 
 
补充关于select在异步(非阻塞)connect中的应用,刚开始搞socket编程的时候 
我一直都用阻塞式的connect,非阻塞connect的问题是由于当时搞proxy scan 
而提出的呵呵 
通过在网上与网友们的交流及查找相关FAQ,总算知道了怎么解决这一问题.同样 
用select可以很好地解决这一问题.大致过程是这样的: 
 
1.将打开的socket设为非阻塞的,可以用fcntl(socket, F_SETFL, O_NDELAY)完 
成(有的系统用FNEDLAY也可). 
 
2.发connect调用,这时返回-1,但是errno被设为EINPROGRESS,意即connect仍旧 
在进行还没有完成. 
 
3.将打开的socket设进被监视的可写(注意不是可读)文件集合用select进行监视, 
如果可写,用 
        getsockopt(socket, SOL_SOCKET, SO_ERROR, &error, sizeof(int)); 
来得到error的值,如果为零,则connect成功. 
 
在许多unix版本的proxyscan程序你都可以看到类似的过程,另外在solaris精华 
区->编程技巧中有一个通用的带超时参数的connect模块. 


===========================================

阻塞与非阻塞

在 server 进入 listen 状态之后, 我们下面分别讨论两种实现方法:
1. fcntl 方法
对一个文件描述符指定的文件或设备, 有两种工作方式: 阻塞与非阻塞, 阻塞的意思是指, 当试图对该文件描述符进行读写时, 如果当时没有东西可读, 或者暂时不可写, 程序就进入等待状态, 直到有东西可读或者可写为止. 而对于非阻塞状态, 如果没有东西可读, 或者不可写, 读写函数马上返回, 而不会等待. 缺省情况下, 文件描述符处于阻塞状态. 在实现聊天室时, server 轮流查询与各client 建立 socket, 一旦可读就将该 socket 中的字符读出来并向所有其他client 发送. 并且, server 还要随时查看是否有新的 client 试图建立连接, 这样, 如果 server 在任何一个地方阻塞了, 其他 client 发送的内容就会受到影响, 新 client 试图建立连接也会受到影响. 因此, 我们使用 fcntl 将该

文件描述符变为非阻塞的:

fcntl( sockfd, F_SETFL, O_NONBLOCK);
// sockfd      是要改变状态的文件描述符.
// F_SETFL     表明要改变文件描述符的状态
// O_NONBLOCK  表示将文件描述符变为非阻塞的.

使用自然语言描述聊天室 server :
while ( 1)
{
   if 有新连接 then 建立并记录该新连接;
   for( 所有的有效连接) 
   {
      if 该连接中有字符可读 then 
      {
         for( 所有其他的有效连接) 
         {
           将该字符串发送给该连接;
         }
      }
   }
}

由于判断是否有新连接, 是否可读都是非阻塞的, 因此每次判断, 不管有还是没有, 都会马上返回. 这样, 任何一个 client 向 server 发送字符或者试图建立新连接, 都不会对其他 client 的活动造成影响. 对 client 而言, 建立连接之后, 只需要处理两个文件描述符, 一个是建立了连接的 socket 描述符, 另一个是标准输入. 和 server 一样, 如果使用阻塞方式的话, 很容易因为其中一个暂时没有输入而影响另外一个的读入. 因此将它们都变成非阻塞的, 然后client 进行如下动作:
while( 不想退出) 
{
    if( 与 server 的连接有字符可读) 
    {
       从该连接读入, 并输出到标准输出上去.
    } 
  
    if ( 标准输入可读) 
    {
      从标准输入读入, 并输出到与 server 的连接中去.
    }
}


分析上面的程序可以知道, 不管是 server 还是 client, 它们都不停的轮流查询各个文件描述符, 一旦可读就读入并进行处理. 这样的程序, 不停的在执行, 只要有CPU 资源, 就不会放过. 因此对系统资源的消耗非常大. server 或者 client 单独执行时, CPU 资源的 98% 左右都被其占用. 因此, 我们可以使用另外一种阻塞的方法来解决这个问题, 这就是 select.



2. select 方法

select 方法中, 所有文件描述符都是阻塞的. 使用 select 判断一 组文件描述符中是否有一个可读(写), 如果没有就阻塞, 直到有一个的时候就被唤醒. 我们先看比较简单的 client 的实现:

由于 client 只需要处理两个文件描述符, 因此, 需要判断是否有可读写的文件描述符只需要加入两项:

FD_ZERO( sockset);          // 将 sockset 清空
FD_SET( sockfd, sockset);   // 把 sockfd 加入到 sockset 集合中
FD_SET( 0, sockset);        // 把 0 (标准输入) 加入到 sockset 集合中

然后 client 的处理如下:
while ( 不想退出) 
{
     select( sockfd+1, &sockset, NULL, NULL, NULL);
     // 此时该函数将阻塞直到标准输入或者 sockfd 中有一个可读为止
     // 第一个参数是 0 和 sockfd 中的最大值加一
     // 第二个参数是 读集, 也就是 sockset
     // 第三, 四个参数是写集和异常集, 在本程序中都为空
     // 第五个参数是超时时间, 即在指定时间内仍没有可读, 则出错
     // 并返回. 当这个参数为NULL 时, 超时时间被设置为无限长.
     // 当 select 因为可读返回时, sockset 中包含的只是可读的
     // 那些文件描述符.
     if( FD_ISSET( sockfd, &sockset)) 
     {
        // FD_ISSET 这个宏判断 sockfd 是否属于可读的文件描述符
        从 sockfd 中读入, 输出到标准输出上去.
     }

     if ( FD_ISSET( 0, &sockset)) 
     {
        // FD_ISSET 这个宏判断 sockfd 是否属于可读的文件描述符
        从标准输入读入, 输出到 sockfd 中去.
     }
     重新设置 sockset. (即将 sockset 清空, 并将 sockfd 和 0 加入)
}



下面看 server 的情况:

设置 sockset 如下:
FD_ZERO( sockset);
FD_SET( sockfd, sockset);
for ( 所有有效连接)
{
    FD_SET( userfd[i], sockset);
}
maxfd = 最大的文件描述符号 + 1;
server 处理如下:
while ( 1) 
{
    select( maxfd, &sockset, NULL, NULL, NULL);
    if ( FD_ISSET( sockfd, &sockset)) 
    {
         // 有新连接
         建立新连接, 并将该连接描述符加入到 sockset 中去了.
    }

    for( 所有有效连接) 
    {
       if( FD_ISSET ( userfd[i], &sockset)) 
       {
          // 该连接中有字符可读
          从该连接中读入字符, 并发送到其他有效连接中去.
       }
    }
    重新设置 sockset;
}

由于采用 select 机制, 因此当没有字符可读时, 程序处于阻塞状态, 最小程度的占用CPU 资源, 在同一台机器上执行一个 server 和若干个client 时, 系统负载只有 0.1 左右, 而采用原来的 fcntl 方法, 只运行一个 server, 系统负载就可以达到 1.5 左右. 因此我们推荐使用 select.
0 0