socket select-re管理器修改mac-程序博客网

作一个tcp的服务程序，同时可能有大量的客户端连上来，希望分别记住各个socket
谁有数据过来，就读出来，放到一个请求队列－－这些事情用一个线程完成

另外有一个结果队列，如果结果里包含了socket的编号，用一个线程专门：
取出来按编号找回原来发送者socket，发回给原来的客户端

还有一个就是处理线程（池），它取出请求队列里的一个请求，进行处理，
把处理结果放入结果队列

不知道有没有现成的框架？
网上只找到一些很。。。的：
http://fanqiang.chinaunix.net/a4/b7/20010508/112359.html
Linux网络编程--9. 服务器模型
http://linuxc.51.net 作者:hoyt (2001-05-08 11:23:59)

学习过《软件工程》吧.软件工程可是每一个程序员"必修"的课程啊.如果你没有学习过, 建议你去看一看. 在这一章里面,我们一起来从软件工程的角度学习网络编程的思想.在我们写程序之前, 我们都应该从软件工程的角度规划好我们的软件,这样我们开发软件的效率才会高. 在网络程序里面,一般的来说都是许多客户机对应一个服务器.为了处理客户机的请求, 对服务端的程序就提出了特殊的要求.我们学习一下目前最常用的服务器模型.

循环服务器:循环服务器在同一个时刻只可以响应一个客户端的请求

并发服务器:并发服务器在同一个时刻可以响应多个客户端的请求

9.1 循环服务器:UDP服务器
UDP循环服务器的实现非常简单:UDP服务器每次从套接字上读取一个客户端的请求,处理, 然后将结果返回给客户机.

可以用下面的算法来实现.

   socket(...);
   bind(...);
   while(1)
    {
         recvfrom(...);
         process(...);
         sendto(...);
   }

因为UDP是非面向连接的,没有一个客户端可以老是占住服务端. 只要处理过程不是死循环, 服务器对于每一个客户机的请求总是能够满足.
9.2 循环服务器:TCP服务器
TCP循环服务器的实现也不难:TCP服务器接受一个客户端的连接,然后处理,完成了这个客户的所有请求后,断开连接.

算法如下:

        socket(...);
        bind(...);
        listen(...);
        while(1)
        {
                accept(...);
                while(1)
                {
                        read(...);
                        process(...);
                        write(...);
                }
                close(...);
        }

TCP循环服务器一次只能处理一个客户端的请求.只有在这个客户的所有请求都满足后, 服务器才可以继续后面的请求.这样如果有一个客户端占住服务器不放时,其它的客户机都不能工作了.因此,TCP服务器一般很少用循环服务器模型的.

9.3 并发服务器:TCP服务器
为了弥补循环TCP服务器的缺陷,人们又想出了并发服务器的模型. 并发服务器的思想是每一个客户机的请求并不由服务器直接处理,而是服务器创建一个子进程来处理.

算法如下:

socket(...);
bind(...);
listen(...);
while(1)
{
        accept(...);
        if(fork(..)==0)
          {
              while(1)
               {
                read(...);
                process(...);
                write(...);
               }
           close(...);
           exit(...);
          }
        close(...);
}

TCP并发服务器可以解决TCP循环服务器客户机独占服务器的情况. 不过也同时带来了一个不小的问题.为了响应客户机的请求,服务器要创建子进程来处理. 而创建子进程是一种非常消耗资源的操作.

9.4 并发服务器:多路复用I/O
为了解决创建子进程带来的系统资源消耗,人们又想出了多路复用I/O模型.

首先介绍一个函数select

int select(int nfds,fd_set *readfds,fd_set *writefds,
fd_set *except fds,struct timeval *timeout)
void FD_SET(int fd,fd_set *fdset)
void FD_CLR(int fd,fd_set *fdset)
void FD_ZERO(fd_set *fdset)
int FD_ISSET(int fd,fd_set *fdset)

一般的来说当我们在向文件读写时,进程有可能在读写出阻塞,直到一定的条件满足. 比如我们从一个套接字读数据时,可能缓冲区里面没有数据可读(通信的对方还没有发送数据过来),这个时候我们的读调用就会等待(阻塞)直到有数据可读.如果我们不希望阻塞,我们的一个选择是用select系统调用. 只要我们设置好select的各个参数,那么当文件可以读写的时候select回"通知"我们说可以读写了. readfds所有要读的文件文件描述符的集合
writefds所有要的写文件文件描述符的集合

exceptfds其他的服要向我们通知的文件描述符

timeout超时设置.

nfds所有我们监控的文件描述符中最大的那一个加1

在我们调用select时进程会一直阻塞直到以下的一种情况发生. 1)有文件可以读.2)有文件可以写.3)超时所设置的时间到.

为了设置文件描述符我们要使用几个宏. FD_SET将fd加入到fdset

FD_CLR将fd从fdset里面清除

FD_ZERO从fdset中清除所有的文件描述符

FD_ISSET判断fd是否在fdset集合中

使用select的一个例子

int use_select(int *readfd,int n)
{
   fd_set my_readfd;
   int maxfd;
   int i;

   maxfd=readfd[0];
   for(i=1;i    if(readfd[i]>maxfd) maxfd=readfd[i];
   while(1)
   {
        /*   将所有的文件描述符加入   */
        FD_ZERO(&my_readfd);
        for(i=0;i            FD_SET(readfd[i],*my_readfd);
        /*     进程阻塞                 */
        select(maxfd+1,& my_readfd,NULL,NULL,NULL);
        /*        有东西可以读了       */
        for(i=0;i          if(FD_ISSET(readfd[i],&my_readfd))
              {
                  /* 原来是我可以读了 */
                        we_read(readfd[i]);
              }
   }
}

使用select后我们的服务器程序就变成了.

        初始话(socket,bind,listen);

    while(1)
        {
        设置监听读写文件描述符(FD_*);

        调用select;

        如果是倾听套接字就绪,说明一个新的连接请求建立
             {
                建立连接(accept);
                加入到监听文件描述符中去;
             }
       否则说明是一个已经连接过的描述符
                {
                    进行操作(read或者write);
                 }

        }

多路复用I/O可以解决资源限制的问题.着模型实际上是将UDP循环模型用在了TCP上面. 这也就带来了一些问题.如由于服务器依次处理客户的请求,所以可能会导致有的客户会等待很久.

9.5 并发服务器:UDP服务器
人们把并发的概念用于UDP就得到了并发UDP服务器模型. 并发UDP服务器模型其实是简单的.和并发的TCP服务器模型一样是创建一个子进程来处理的算法和并发的TCP模型一样.

除非服务器在处理客户端的请求所用的时间比较长以外,人们实际上很少用这种模型.

9.6 一个并发TCP服务器实例

#include
#include
#include
#include
#include
#define MY_PORT         8888

int main(int argc ,char **argv)
{
int listen_fd,accept_fd;
struct sockaddr_in     client_addr;
int n;

if((listen_fd=socket(AF_INET,SOCK_STREAM,0))<0)
{
        printf("Socket Error:%s\n\a",strerror(errno));
        exit(1);
}

bzero(&client_addr,sizeof(struct sockaddr_in));
client_addr.sin_family=AF_INET;
client_addr.sin_port=htons(MY_PORT);
client_addr.sin_addr.s_addr=htonl(INADDR_ANY);
n=1;
/* 如果服务器终止后,服务器可以第二次快速启动而不用等待一段时间 */
setsockopt(listen_fd,SOL_SOCKET,SO_REUSEADDR,&n,sizeof(int));
if(bind(listen_fd,(struct sockaddr *)&client_addr,sizeof(client_addr))<0)
{
        printf("Bind Error:%s\n\a",strerror(errno));
        exit(1);
}
listen(listen_fd,5);
while(1)
{
   accept_fd=accept(listen_fd,NULL,NULL);
   if((accept_fd<0)&&(errno==EINTR))
          continue;
   else if(accept_fd<0)
    {
        printf("Accept Error:%s\n\a",strerror(errno));
        continue;
    }
if((n=fork())==0)
   {
        /* 子进程处理客户端的连接 */
        char buffer[1024];

        close(listen_fd);
        n=read(accept_fd,buffer,1024);
        write(accept_fd,buffer,n);
        close(accept_fd);
        exit(0);
   }
   else if(n<0)
        printf("Fork Error:%s\n\a",strerror(errno));
   close(accept_fd);
}
}

你可以用我们前面写客户端程序来调试着程序,或者是用来telnet调试

http://bbs.chinaitlab.com/dispbbs.asp?boardid=148&id=114926
阻塞
　　阻塞，你也许早就听说了。"阻塞"是 "sleep" 的科技行话。你可能注意到前面运行的 listener 程序，它在那里不停地运行，等待数据包的到来。实际在运行的是它调用 recvfrom()，然后没有数据，因此 recvfrom() 说" 阻塞 (block)"，直到数据的到来。
很多函数都利用阻塞。accept() 阻塞，所有的 recv*() 函数阻塞。它们之所以能这样做是因为它们被允许这样做。当你第一次调用 socket() 建立套接字描述符的时候，内核就将它设置为阻塞。如果你不想套接字阻塞，你就要调用函数 fcntl()：
#include <unistd.h>
　　#include <fontl.h>
　　 .
　　 .
　　 sockfd = socket(AF_INET, SOCK_STREAM, 0);
　　 fcntl(sockfd, F_SETFL, O_NONBLOCK);
　　 .
　　 .
　　通过设置套接字为非阻塞，你能够有效地"询问"套接字以获得信息。如果你尝试着从一个非阻塞的套接字读信息并且没有任何数据，它不允许阻塞--它将返回 -1 并将 errno 设置为 EWOULDBLOCK。
但是一般说来，这种询问不是个好主意。如果你让你的程序在忙等状态查询套接字的数据，你将浪费大量的 CPU 时间。更好的解决之道是用下一章讲的 select() 去查询是否有数据要读进来。
--------------------------------------------------------------------------------
select()--多路同步 I/O
　　虽然这个函数有点奇怪，但是它很有用。假设这样的情况：你是个服务器，你一边在不停地从连接上读数据，一边在侦听连接上的信息。没问题，你可能会说，不就是一个 accept() 和两个 recv() 吗? 这么容易吗，朋友? 如果你在调用 accept() 的时候阻塞呢? 你怎么能够同时接受 recv() 数据? “用非阻塞的套接字啊！” 不行！你不想耗尽所有的 CPU 吧? 那么，该如何是好?
select() 让你可以同时监视多个套接字。如果你想知道的话，那么它就会告诉你哪个套接字准备读，哪个又准备写，哪个套接字又发生了例外 (exception)。
闲话少说，下面是 select()：
#include <sys/time.h>
　　#include <sys/types.h>
　　#include <unistd.h>
int select(int numfds, fd_set *readfds, fd_set *writefds,fd_set
*exceptfds, struct timeval *timeout);
这个函数监视一系列文件描述符，特别是 readfds、writefds 和 exceptfds。如果你想知道你是否能够从标准输入和套接字描述符 sockfd 读入数据，你只要将文件描述符 0 和 sockfd 加入到集合 readfds 中。参数 numfds 应该等于最高的文件描述符的值加1。在这个例子中，你应该设置该值为 sockfd+1。因为它一定大于标准输入的文件描述符 (0)。当函数 select() 返回的时候，readfds 的值修改为反映你选择的哪个文件描述符可以读。你可以用下面讲到的宏 FD_ISSET() 来测试。在我们继续下去之前，让我来讲讲如何对这些集合进行操作。每个集合类型都是 fd_set。下面有一些宏来对这个类型进行操作：
FD_ZERO(fd_set *set) – 清除一个文件描述符集合
　　FD_SET(int fd, fd_set *set) - 添加fd到集合
　　FD_CLR(int fd, fd_set *set) – 从集合中移去fd
　　FD_ISSET(int fd, fd_set *set) – 测试fd是否在集合中
最后，是有点古怪的数据结构 struct timeval。有时你可不想永远等待别人发送数据过来。也许什么事情都没有发生的时候你也想每隔96秒在终端上打印字符串 "Still Going..."。这个数据结构允许你设定一个时间，如果时间到了，而 select() 还没有找到一个准备好的文件描述符，它将返回让你继续处理。
数据结构 struct timeval 是这样的：
struct timeval {
　　 int tv_sec; /* seconds */
　　 int tv_usec; /* microseconds */
　　 };
只要将 tv_sec 设置为你要等待的秒数，将 tv_usec 设置为你要等待的微秒数就可以了。是的，是微秒而不是毫秒。1,000微秒等于1毫秒，1,000 毫秒等于1秒。也就是说，1秒等于1,000,000微秒。为什么用符号 "usec" 呢? 字母 "u" 很象希腊字母 Mu，而 Mu 表示 "微" 的意思。当然，函数返回的时候 timeout 可能是剩余的时间，之所以是可能，是因为它依赖于你的 Unix 操作系统。
哈！我们现在有一个微秒级的定时器！别计算了，标准的 Unix 系统的时间片是100毫秒，所以无论你如何设置你的数据结构 struct timeval，你都要等待那么长的时间。
还有一些有趣的事情：如果你设置数据结构 struct timeval 中的数据为 0，select() 将立即超时，这样就可以有效地轮询集合中的所有的文件描述符。如果你将参数 timeout 赋值为 NULL，那么将永远不会发生超时，即一直等到第一个文件描述符就绪。最后，如果你不是很关心等待多长时间，那么就把它赋为 NULL 吧。
下面的代码演示了在标准输入上等待 2.5 秒：
#include <sys/time.h>
　　#include <sys/types.h>
　　#include <unistd.h>
#define STDIN 0 /* file descriptor for standard input */
main()
　　 {
　　struct timeval tv;
　　fd_set readfds;
tv.tv_sec = 2;
　　tv.tv_usec = 500000;
FD_ZERO(&readfds);
　　FD_SET(STDIN, &readfds);
/* don't care about writefds and exceptfds: */
　　select(STDIN+1, &readfds, NULL, NULL, &tv);
if (FD_ISSET(STDIN, &readfds))
　　printf("A key was pressed!\n");
　　else
　　printf("Timed out.\n");
　　}
如果你是在一个 line buffered 终端上，那么你敲的键应该是回车 (RETURN)，否则无论如何它都会超时。
现在，你可能回认为这就是在数据报套接字上等待数据的方式--你是对的：它可能是。有些 Unix 系统可以按这种方式，而另外一些则不能。你在尝试以前可能要先看看本系统的 man page 了。
最后一件关于 select() 的事情：如果你有一个正在侦听 (listen()) 的套接字，你可以通过将该套接字的文件描述符加入到 readfds 集合中来看是否有新的连接。
这就是我关于函数select() 要讲的所有的东西。

WinSock I/O系列1：多路复用I/O支持多Client的实现及效率讨论     选择自 HuangRG 的 Blog
关键字   多路复用I/O select效率多客户端
出处

1.       引言

多路复用I/O模型(select)是UNIX/LINUX用得的最多的一种I/O模型，在Windows下也

可做为一种同步I/O使用。本文给出该I/O模型处理多Client的简单（在主线程中）实现。

2. 关于select

select I/O模型是一种异步I/O模型，在单线程中Linux/WinNT默认支持64个客户端套

接字。这种I/O模型主要涉及以下几个函数及宏：

int select(…)、FD_ZERO、FD_SET、FD_ISSET以及FD_SETSIZE。

3. 用select开发一个Server

3.1 只支持单个Client

// 相关初始化处理, 创建监听套接字

listen(listensock, 5);

clientsock = accept(listensock, NULL, NULL);

for (; ;)

{

FD_ZERO(&readfds);

FD_SET(clientsock, &readfds);

nResult = select(

0, // Windows中这个参数忽略，Linux中在此处为1

readfds, // 可读套接字集合

……

)

if (nResult = = SOCKET_ERROR)

return –1;

// 判断cliensock是否处于待读状态

if (FD_ISSET(clientsock, &readfds))

{
// 相关处理

}

其实Winsock中的WSAEventSelect模型是与之类似的。

3.2 在单线程中支持63个Client

SOCKET clientsockarray[FD_SETSIZE – 1]; // FD_SETSIZE is 64

// 相关初始化处理, 创建监听套接字

listen(listensock, 5);

// 初始化套接字数组

InitSock(clientsockarray);

FD_ZERO(&readfds);

FD_SET(listensock, &readfds);

for (; ;)

{

nRet = select(0, &readfds, NULL, NULL, NULL);

// 判断监听套接字是否可读

if (FD_ISSET(listensock, &readfds))

{

clientsock = accept(listensock, NULL, NULL);

// 将客户套接字放到套接字数组中

if (!InsertSock(clientsockarray, clientsock))

{

printf("客户端超过了63个,此次连接被拒绝.\n");

closesocket(clientsock);

continue;

}

// 逐个处理处于待决状态的套接字

for (nIndex = 0; nIndex < FD_SETSIZE - 1; nIndex++)

{

if (FD_ISSET(clientsockarray[nIndex], &readfds))

{

nRet = recv(clientsockarray[nIndex], buff, sizeof(buff), 0);

if (nRet = = 0 || nRet = = SOCKET_ERROR)

{

closesocket(clientsockarray[nIndex]);

clientsockarray[nIndex] = INVALID_SOCKET;

continue; // 继续处理套接字句柄数组中的其它套接字

}

// 将接受到的数据进行处理,此处只将其输出

printf("%s\n", buff);

}

// 初始化套接字集合

FD_ZERO(&readfds);

FD_SET(listensock, &readfds);

// 将所有有效的套接字句柄加入到套接字句柄数组中

for (nIndex = 0; nIndex < FD_SETSIZE - 1; nIndex++)

{

if (clientsockarray[nIndex] != INVALID_SOCKET)

FD_SET(clientsockarray[nIndex], &readfds);

}

BOOL InsertSock(SOCKET* pSock, SOCKET sock)

{

for (int nIndex = 0; nIndex < FD_SETSIZE – 1; nIndex++)

{
if (pSock[nIndex] = = INVALID_SOCKET)

{

pSock[nIndex] = sock;

break;

}

if (nIndex = = FD_SETSIZE – 1)

return FALSE;

return TRUE;

}

上面只是给简要的代码，有的辅助函数也没有给出。用select支持多Client是比较方便的，在一个线程中可支持63个；可以采用多线程支持更大数量的Client。

4. 效率的讨论

4.1 对套接字数组扫描的效率问题

在上面的程序中，存在多处对套接字句柄的扫描处理，这个肯定会影响效率。不知道各位朋友是怎么处理这个问题的。

4.2 对客户端实时响应问题

上面的程序处理待决的套接字的时候，是逐个处理的，如果响应某个Client的时间长到一定程度的话，肯定会影响对其它客户端的响应。我的解决方法是当这个套接字处于可读的待决状态的话，产生一个子线程去处理------接收数据和处理数据。这样主线程继续自己的工作，其它Client可以得及时的响应；当然当有大量的Client请求时，对线程的控制会成为一个新问题。

在UNIX/LINUX下做一个支持大量Client的Server的话，本人还是最先选择select这种I/O模型，这是因为我还不知道LINUX还有哪些更好的I/O模型。WinNT的话，还有 CompletionPort和Overlapped，特别对于有大数据量传送，同时只有少量的Client时，Overlapped可以发挥相当大的作用。各位朋友请给出使用select的好方法。

[转帖]select()的作用
select()的作用应该是这样的：

1.由任务调用select()：

void myTask()
{
...
select(width, readFds, writeFds, exceptFds, timeout);
...
}
select()意思是说：若readFds集合中的任一个fd可读，或writeFds中的任一个fd可写，或exceptFds中的任一个fd出异常（目前VxWorks还不支持），或者timeout指定的时间超时，则select()返回；否则任务myTask()处于阻塞状态，直到上述的条件之一得到满足。

2. select()的伪代码“可能”类似于：

select()
{
// selWakeupNode结构可能是malloc得到的，或者静态的。不清楚。
selWakeupNode->taskId = taskIdSelf();

selWakeupNode->type = SELREAD;
for (each fd in readFds)
ioctl(fd, FIOSELECT, (int)selWakeupNode);

selWakeupNode->type = SELWRITE;
for (each fd in writeFds)
ioctl(fd, FIOSELECT, (int)selWakeupNode);

semTake(tcb->semSelect, timeout); // 进入阻塞状态；睡觉去了

selWakeupNode->type = SELREAD;
for (each fd in readFds)
ioctl(fd, FIOUNSELECT, selWakeupNode);

selWakeupNode->type = SELWRITE;
for (each fd in writeFds)
ioctl(fd, FIOUNSELECT, selWakeupNode);
}
FIOSELECT命令是告诉驱动程序：“我对您设备的可读/可写感兴趣，请在满足条件时务必通知我。别忘了，我叫selWakeupNode->taskId，我对selWakeupNode->type感兴趣。”
睡眠醒来后，任务又说：“ok，都别管我了。”

3. （2）中的每一个ioctl调用都会转换为和fd相关联的驱动程序的xxIoctl()的调用：

xxIoctl(pXxDev, function, arg)
{
switch (function) {
...
case FIOSELECT:
if ((retval = selNodeAdd(&pXxDev->selWakeupList, // 可能有多个任务要处理，用链表记住它们
(SEL_WAKEUP_NODE *)arg)) == OK) {
if ((selWakeupType(arg) == SELREAD && ‘当前可读’) ||
(selWakeupType(arg) == SELWRITE && ‘当前可写’))
selWakeup(arg); // 不用等待，醒来吧
}
return retval;

case FIOUNSELECT: // 该任务对我不感兴趣了...
return selNodeDelete(&pXxDev->selWakeupList,
(SEL_WAKUP_NODE *)arg);
...
}
}
字符设备（character device）驱动程序如果要支持select，必须处理FIOSELECT和FIOUNSELECT命令。一般在设备控制结构中定义select-wakeup-list，并在创建设备时初始化。

4. xx设备在发生中断时，ISR被调用：

xxInt(pXxDev)
{
// 读状态寄存器

if (''接收到数据'')// 可读
selWakeupAll(&pXxDev->selWakeupList, SELREAD);

if (''数据已发送'')// 可写
selWakeupAll(&pXxDev->selWakeupList, SELWRITE);

...
}
中断函数中根据情况唤醒所有等待可读/可写的任务。selWakeup()和selWakeupAll()都是I/O系统中的函数，看不到源码。猜想它们的伪码如下：

selWakeup(node)
{
semGive(node->taskId->semSelect); // 唤醒等待的任务
}

selWakeupAll(list, type)
{
for (each node in list)
if (node->type == type)
semGive(node->taskId->semSelect); // 唤醒等待的任务
}