Linux select

来源:互联网 发布:淘宝苹果id解锁可信吗 编辑:程序博客网 时间:2024/06/03 08:07

SelectSocket编程中还是比较重要的,可是对于初学Socket的人来说都不太爱用Select写程序,他们只是习惯写诸如connectacceptrecvrecvfrom这样的阻塞程序(所谓阻塞方式block,顾名思义,就是进程或是线程执行到这些函数时必须等待某个事件的发生,如果事件没有发生,进程或线程就被阻塞,函数不能立即返回)。可是使用Select就可以完成非阻塞(所谓非阻塞方式non-block,就是进程或线程执行此函数时不必非要等待事件的发生,一旦执行肯定返回,以返回值的不同来反映函数的执行情况,如果事件发生则与阻塞方式相同,若事件没有发生则返回一个代码来告知事件未发生,而进程或线程继续执行,所以效率较高)方式工作的程序,它能够监视我们需要监视的文件描述符的变化情况——读写或是异常。下面详细介绍一下!

Select的函数格式(我所说的是Unix系统下的伯克利socket编程,和windows下的有区别,一会儿说明)

int select(int maxfdp,fd_set *readfds,fd_set *writefds,fd_set *errorfds,struct timeval *timeout);

先说明两个结构体:

    1struct fd_set可以理解为一个集合,这个集合中存放的是文件描述符(file descriptor),即文件句柄,这可以是我们所说的普通意义的文件,当然Unix下任何设备、管道、FIFO等都是文件形式,全部包括在内,所以毫无疑问一个socket就是一个文件,socket句柄就是一个文件描述符。fd_set集合可以通过一些宏由人为来操作,比如清空集合FD_ZERO(fd_set *),将一个给定的文件描述符加入集合之中FD_SET(int ,fd_set *),将一个给定的文件描述符从集合中删除FD_CLR(int ,fd_set*),检查集合中指定的文件描述符是否可以读写FD_ISSET(int ,fd_set* )。一会儿举例说明。

    2struct timeval是一个大家常用的结构,用来代表时间值,有两个成员,一个是秒数,另一个是毫秒数。

具体解释select的参数:

int maxfdp是一个整数值,是指集合中所有文件描述符的范围,即所有文件描述符的最大值加1,不能错!在Windows中这个参数的值无所谓,可以设置不正确。

fd_set *readfds是指向fd_set结构的指针,这个集合中应该包括文件描述符,我们是要监视这些文件描述符的读变化的,即我们关心是否可以从这些文件中读取数据了,如果这个集合中有一个文件可读,select就会返回一个大于0的值,表示有文件可读,如果没有可读的文件,则根据timeout参数再判断是否超时,若超出timeout的时间,select返回0,若发生错误返回负值。可以传入NULL值,表示不关心任何文件的读变化。

fd_set *writefds是指向fd_set结构的指针,这个集合中应该包括文件描述符,我们是要监视这些文件描述符的写变化的,即我们关心是否可以向这些文件中写入数据了,如果这个集合中有一个文件可写,select就会返回一个大于0的值,表示有文件可写,如果没有可写的文件,则根据timeout参数再判断是否超时,若超出timeout的时间,select返回0,若发生错误返回负值。可以传入NULL值,表示不关心任何文件的写变化。

fd_set *errorfds同上面两个参数的意图,用来监视文件错误异常。

struct timeval* timeoutselect的超时时间,这个参数至关重要,它可以使select处于三种状态,第一,若将NULL以形参传入,即不传入时间结构,就是将select置于阻塞状态,一定等到监视文件描述符集合中某个文件描述符发生变化为止;第二,若将时间值设为00毫秒,就变成一个纯粹的非阻塞函数,不管文件描述符是否有变化,都立刻返回继续执行,文件无变化返回0,有变化返回一个正值;第三,timeout的值大于0,这就是等待的超时时间,即selecttimeout时间内阻塞,超时时间之内有事件到来就返回了,否则在超时后不管怎样一定返回,返回值同上述。

返回值:

负值:select错误
正值:某些文件可读写或出错
0:等待超时,没有可读写或错误的文件

在有了select后可以写出像样的网络程序来!举个简单的例子,就是从网络上接受数据写入一个文件中。

例子:
main()
{
       int sock;
       FILE *fp;
       struct fd_set fds;
       struct timeval timeout={3,0}; //select
等待3秒,3秒轮询,要非阻塞就置
0
       char buffer[256]={0}; //256
字节的接收缓冲区
       /* 假定已经建立UDP连接,具体过程不写,简单,当然TCP也同理,主机ipport都已经给定,要写的文件已经打开
       sock=socket(...);
       bind(...);
       fp=fopen(...); */
       while(1)
       {
              FD_ZERO(&fds); //
每次循环都要清空集合,否则不能检测描述符变化
              FD_SET(sock,&fds); //添加描述符
              FD_SET(fp,&fds); //同上
              maxfdp=sock>fp?sock+1:fp+1; //描述符最大值加
1
              switch(select(maxfdp,&fds,&fds,NULL,&timeout)) //select
使用
              {
                     case -1: exit(-1);break; //select
错误,退出程序
                     case 0:break; //再次轮询
                     default:
                     if(FD_ISSET(sock,&fds)) //
测试sock是否可读,即是否网络上有数据
                     {
                            recvfrom(sock,buffer,256,.....);//
接受网络数据
                            if(FD_ISSET(fp,&fds)) //测试文件是否可写
                                   fwrite(fp,buffer...);//写入文件
                            buffer清空
;
                     }// end if break;
              }// end switch
       }//end while
}//end main

select()
的机制中提供一fd_set的数据结构,实际上是一long类型的数组,
每一个数组元素都能与一打开的文件句柄(不管是Socket句柄,还是其他
文件或命名管道或设备句柄)建立联系,建立联系的工作由程序员完成,
当调用select()时,由内核根据IO状态修改fd_set的内容,由此来通知执
行了select()的进程哪一Socket或文件可读,下面具体解释:

#include <sys/types.h>
#include <sys/times.h>
#include <sys/select.h>

int select(nfds, readfds, writefds, exceptfds, timeout)
int nfds;
fd_set *readfds, *writefds, *exceptfds;
struct timeval *timeout;

ndfs
select监视的文件句柄数,视进程中打开的文件数而定,一般设为呢要监视各文件
中的最大文件号加一。
readfdsselect监视的可读文件句柄集合。
writefds: select监视的可写文件句柄集合。
exceptfdsselect监视的异常文件句柄集合。
timeout:本次select()的超时结束时间。(见/usr/sys/select.h
可精确至百万分之一秒!)

readfdswritefds中映象的文件可读或可写或超时,本次
select()
就结束返回。程序员利用一组系统提供的宏在select()结束时便可判
断哪一文件可读或可写。对Socket编程特别有用的就是readfds
几只相关的宏解释如下:

FD_ZERO(fd_set *fdset):清空fdset与所有文件句柄的联系。
FD_SET(int fd, fd_set *fdset):建立文件句柄fdfdset的联系。
FD_CLR(int fd, fd_set *fdset):清除文件句柄fdfdset的联系。
FD_ISSET(int fd, fdset *fdset):检查fdset联系的文件句柄fd是否可读写,>0表示可读写。
(关于fd_set及相关宏的定义见/usr/include/sys/types.h

这样,你的socket只需在有东东读的时候才读入,大致如下:
...
int sockfd;
fd_set fdR;
struct timeval timeout = ..;
...
for(;;) {
FD_ZERO(&fdR);
FD_SET(sockfd, &fdR);
switch (select(sockfd + 1, &fdR, NULL, &timeout)) {
case -1:
error handled by u;
case 0:
timeout hanled by u;
default:
if (FD_ISSET(sockfd)) {
now u read or recv something;
/* if sockfd is father and
server socket, u can now
accept() */
}
}
}

所以一个FD_ISSET(sockfd)就相当通知了sockfd可读。至于struct timeval在此的功能,请man select。不同的timeval设置使select()表现出超时结束、无超时阻塞和轮询三种特性。由于timeval可精确至百万分之一秒,所以WindowsSetTimer()根本不算什么。你可以用select()做一个超级时钟。

FD_ACCEPT的实现?依然如上,因为客户端socket请求连接时,会发送连接请求报文,此时select()当然会结束,FD_ISSET(sockfd)当然大于零,因为有报文可读嘛!至于这方面的应用,主要在于服务方的父Socket,你若不喜欢主动accept(),可改为如上机制来accept()

至于FD_CLOSE的实现及处理,颇费了一堆cpu处理时间,未完待续。

讨论关于利用select()检测对方Socket关闭的问题:

仍然是本地Socket有东东可读,因为对方Socket关闭时,会发一个关闭连接通知报文,会马上被select()检测到的。关于TCP的连接(三次握手)和关闭(二次握手)机制,敬请参考有关TCP/IP的书籍。

不知是什么原因,UNIX好象没有提供通知进程关于SocketPipe对方关闭的信号,也可能是cpu所知有限。总之,当对方关闭,一执行recv()read(),马上回返回-1,此时全局变量errno的值是115,相应的sys_errlist[errno]"Connect refused"(请参考/usr/include/sys/errno.h)。所以,在上篇的for(;;)...select()程序块中,当有东西可读时,一定要检查recv()read()的返回值,返回-1时要作出关断本地Socket的处理,否则select()会一直认为有东西读,其结果曾几令cpu伤心欲断针脚。不信你可以试试:不检查recv()返回结果,且将收到的东东(实际没收到)写至标准输出...在有名管道的编程中也有类似问题出现。具体处理详见拙作:发布一个有用的Socket客户方原码。

至于主动写Socket时对方突然关闭的处理则可以简单地捕捉信号SIGPIPE并作出相应关断本地Socket等等的处理。SIGPIPE的解释是:写入无读者方的管道。
在此不作赘述,请详man signal

补充关于select在异步(非阻塞)connect中的应用,刚开始搞socket编程的时候我一直都用阻塞式的connect,非阻塞connect的问题是由于当时搞proxy scan而提出的呵呵通过在网上与网友们的交流及查找相关FAQ,总算知道了怎么解决这一问题.同样用select可以很好地解决这一问题.大致过程是这样的
:

1.
打开的socket设为非阻塞的,可以用fcntl(socket, F_SETFL, O_NDELAY)完成(有的系统用FNEDLAY也可
).

2.
connect调用,这时返回-1,但是errno被设为EINPROGRESS,意即connect仍旧在进行还没有完成
.

3.
将打开的socket设进被监视的可写(注意不是可读)文件集合用select进行监视,如果可写,
getsockopt(socket, SOL_SOCKET, SO_ERROR, &error, sizeof(int));
来得到error的值,如果为零,connect成功
.

在许多unix版本的proxyscan程序你都可以看到类似的过程,另外在solaris精华区->编程技巧中有一个通用的带超时参数的connect模块.

使用select函数可以以非阻塞的方式和多个socket通信。程序只是演示select函数的使用,功能非常简单,即使某个连接关闭以后也不会修改当前连接数,连接数达到最大值后会终止程序。

1. 程序使用了一个数组fd_A,通信开始后把需要通信的多个socket描述符都放入此数组。

2. 首先生成一个叫sock_fd的socket描述符,用于监听端口。

3. 将sock_fd和数组fd_A中不为0的描述符放入select将检查的集合fdsr。

4. 处理fdsr中可以接收数据的连接。如果是sock_fd,表明有新连接加入,将新加入连接的socket描述符放置到fd_A。

#include <stdio.h>#include <stdlib.h>#include <unistd.h>#include <errno.h>#include <string.h>#include <sys/types.h>#include <sys/socket.h>#include <netinet/in.h>#include <arpa/inet.h>#define MYPORT 1234    // the port users will be connecting to#define BACKLOG 5     // how many pending connections queue will hold#define BUF_SIZE 200int fd_A[BACKLOG];    // accepted connection fdint conn_amount;    // current connection amountvoid showclient(){    int i;    printf("client amount: %d\n", conn_amount);    for (i = 0; i < BACKLOG; i++) {        printf("[%d]:%d  ", i, fd_A[i]);    }    printf("\n\n");}int main(void){    int sock_fd, new_fd;  // listen on sock_fd, new connection on new_fd    struct sockaddr_in server_addr;    // server address information    struct sockaddr_in client_addr; // connector's address information    socklen_t sin_size;    int yes = 1;    char buf[BUF_SIZE];    int ret;    int i;    if ((sock_fd = socket(AF_INET, SOCK_STREAM, 0)) == -1) {        perror("socket");        exit(1);    }    if (setsockopt(sock_fd, SOL_SOCKET, SO_REUSEADDR, &yes, sizeof(int)) == -1) {        perror("setsockopt");        exit(1);    }        server_addr.sin_family = AF_INET;         // host byte order    server_addr.sin_port = htons(MYPORT);     // short, network byte order    server_addr.sin_addr.s_addr = INADDR_ANY; // automatically fill with my IP    memset(server_addr.sin_zero, '\0', sizeof(server_addr.sin_zero));    if (bind(sock_fd, (struct sockaddr *)&server_addr, sizeof(server_addr)) == -1) {        perror("bind");        exit(1);    }    if (listen(sock_fd, BACKLOG) == -1) {        perror("listen");        exit(1);    }    printf("listen port %d\n", MYPORT);    fd_set fdsr;    int maxsock;    struct timeval tv;    conn_amount = 0;    sin_size = sizeof(client_addr);    maxsock = sock_fd;    while (1) {        // initialize file descriptor set        FD_ZERO(&fdsr);        FD_SET(sock_fd, &fdsr);        // timeout setting        tv.tv_sec = 30;        tv.tv_usec = 0;        // add active connection to fd set        for (i = 0; i < BACKLOG; i++) {            if (fd_A[i] != 0) {                FD_SET(fd_A[i], &fdsr);            }        }        ret = select(maxsock + 1, &fdsr, NULL, NULL, &tv);        if (ret < 0) {            perror("select");            break;        } else if (ret == 0) {            printf("timeout\n");            continue;        }        // check every fd in the set        for (i = 0; i < conn_amount; i++) {            if (FD_ISSET(fd_A[i], &fdsr)) {                ret = recv(fd_A[i], buf, sizeof(buf), 0);                if (ret <= 0) {        // client close                    printf("client[%d] close\n", i);                    close(fd_A[i]);                    FD_CLR(fd_A[i], &fdsr);                    fd_A[i] = 0;                } else {        // receive data                    if (ret < BUF_SIZE)                        memset(&buf[ret], '\0', 1);                    printf("client[%d] send:%s\n", i, buf);                }            }        }        // check whether a new connection comes        if (FD_ISSET(sock_fd, &fdsr)) {            new_fd = accept(sock_fd, (struct sockaddr *)&client_addr, &sin_size);            if (new_fd <= 0) {                perror("accept");                continue;            }            // add to fd queue            if (conn_amount < BACKLOG) {                fd_A[conn_amount++] = new_fd;                printf("new connection client[%d] %s:%d\n", conn_amount,                        inet_ntoa(client_addr.sin_addr), ntohs(client_addr.sin_port));                if (new_fd > maxsock)                    maxsock = new_fd;            }            else {                printf("max connections arrive, exit\n");                send(new_fd, "bye", 4, 0);                close(new_fd);                break;            }        }        showclient();    }    // close other connections    for (i = 0; i < BACKLOG; i++) {        if (fd_A[i] != 0) {            close(fd_A[i]);        }    }    exit(0);}


 

 

原创粉丝点击