【转】 Linux网络服务器socket编程

来源：互联网发布：参加淘宝双十一条件编辑：程序博客网时间：2024/04/27 22:43

Linux系统网络服务器模型主要有两种：并发服务器和循环服务器。所谓并发服务器就是在同一个时刻可以处理来自多个客户端的请求；循环服务器是指服务器在同一时刻指可以响应一个客户端的请求。而且对于TCP和UDP套接字，这两种服务器的实现方式也有不同的特点。

1、TCP循环服务器：首先TCP服务器接受一个客户端的连接请求，处理连接请求，在完成这个客户端的所有请求后断开连接，然后再接受下一个客户端的请求。

创建TCP循环服务器的算法如下：

socket(……)； //创建一个TCP套接字

bind(……)； //邦定公认的端口号

listen(……）； //倾听客户端连接

while(1） //开始循环接收客户端连接

{

accept(……)；//接收当前客户端的连接

while(1)

{ //处理当前客户端的请求

read(……）；

process(……);

write(……);

}

close(……); //关闭当前客户端的连接，准备接收下一个客户端连接

}

TCP循环服务器一次只处理一个客户端的请求，如果有一个客户端占用服务器不放时，其它的客户机连接请求都得不到及时的响应。因此，TCP服务器一般很少用循环服务器模型的。

2、TCP并发服务器：并发服务器的思想是每一个客户端的请求并不由服务器的主进程直接处理，而是服务器主进程创建一个子进程来处理。

创建TCP并发服务器的算法如下：

socket(……)； //创建一个TCP套接字

bind(……)； //邦定公认的端口号

listen(……）；//倾听客户端连接

while(1） //开始循环接收客户端的接收

{

accept(……)；//接收一个客户端的连接

if(fork(……)==0) //创建子进程

{

while(1)

{ //子进程处理某个客户端的连接

read(……）；

process(……);

write(……);

}

close(……); //关闭子进程处理的客户端连接

exit(……) ；//终止该子进程

}

close（……); //父进程关闭连接套接字描述符，准备接收下一个客户端连接

}

TCP并发服务器可以解决TCP循环服务器客户端独占服务器的情况。但同时也带来了一个不小的问题，即响应客户机的请求，服务器要创建子进程来处理，而创建子进程是一种非常消耗资源的操作。

3、UDP循环服务器：UDP服务器每次从套接字上读取一个客户端的数据报请求，处理接收到的UDP数据报，然后将结果返回给客户机。

创建UDP循环服务器的算法如下：

socket(……); //创建一个数据报类型的套接字

bind(……); //邦定公认的短口号

while(1) //开始接收客户端的连接

{ //接收和处理客户端的UDP数据报

recvfrom(……);

process(……);

sendto(……);

//准备接收下一个客户机的数据报

}

因为UDP是非面向连接的，没有一个客户端可以独占服务器。只要处理过程不是死循环，服务器对于每一个客户机的请求总是能够处理的。

UDP循环服务器在数据报流量过大时由于处理任务繁重可能造成客户技数据报丢失，但是因为UDP协议本身不保证数据报可靠到达，所以UDP协议是尤许丢失数据报的。

鉴于以上两点，一般的UDP服务器采用循环方式

4、UDP并发服务器

把并发的概念应用UDP就得到了并发UDP服务器，和并发TCP服务器模型一样是创建子进程来处理的。

创建UDP并发服务器的算法如下：

socket(……); //创建一个数据报类型的套接字

bind(……); //邦定公认的短口号

while(1) //开始接收客户端的连接

{ //接收和处理客户端的UDP数据报

recvfrom(……);

if(fork(……)==0) //创建子进程

{

process(……);

sendto(……);

}

除非服务器在处理客户端的请求所用的时间比较长以外，人们实际上很少用这种UDP并发服务器模型的。

5、多路复用I/O并发服务器：创建子进程会带来系统资源的大量消耗，为了解决这个问题，采用多路复用I/O模型的并发服务器。采用select函数创建多路复用I/O模型的并发服务器的算法如下：

初始化(socket,bind,listen);

while(1)

{

设置监听读写文件描述符（FD_*）；

调用select;

如果是倾听套接字就绪，说明一个新的连接请求建立

{

建立连接（accept）；

加入到监听文件描述符中去；

}

否则说明是一个已经连接过的描述符

{

进行操作(read或者write);

}

多路复用I/O可以解决资源限制问题，此模型实际上是将UDP循环模型用在了TCP上面。这也会带了一些问题，如由于服务器依次处理客户的请求，所以可能导致友的客户会等待很久。

阻塞
　　阻塞，你也许早就听说了。"阻塞"是"sleep" 的科技行话。你可能注意到前面运行的 listener 程序，它在那里不停地运行，等待数据包的到来。实际在运行的是它调用 recvfrom()，然后没有数据，因此 recvfrom() 说" 阻塞 (block)"，直到数据的到来。
很多函数都利用阻塞。accept() 阻塞，所有的 recv*() 函数阻塞。它们之所以能这样做是因为它们被允许这样做。当你第一次调用 socket() 建立套接字描述符的时候，内核就将它设置为阻塞。如果你不想套接字阻塞，你就要调用函数 fcntl()：
　　 sockfd = socket(AF_INET, SOCK_STREAM, 0);
　　 fcntl(sockfd, F_SETFL, O_NONBLOCK);
　　通过设置套接字为非阻塞，你能够有效地"询问"套接字以获得信息。如果你尝试着从一个非阻塞的套接字读信息并且没有任何数据，它不允许阻塞--它将返回 -1 并将 errno 设置为 EWOULDBLOCK。但是一般说来，这种询问不是个好主意。如果你让你的程序在忙等状态查询套接字的数据，你将浪费大量的 CPU 时间。更好的解决之道是用下一章讲的 select() 去查询是否有数据要读进来。
--------------------------------------------------------------------------------
select()--多路同步 I/O
　　虽然这个函数有点奇怪，但是它很有用。假设这样的情况：你是个服务器，你一边在不停地从连接上读数据，一边在侦听连接上的信息。没问题，你可能会说，不就是一个accept() 和两个recv() 吗? 这么容易吗，朋友? 如果你在调用accept() 的时候阻塞呢? 你怎么能够同时接受recv() 数据? “用非阻塞的套接字啊！” 不行！你不想耗尽所有的 CPU 吧? 那么，该如何是好?
select() 让你可以同时监视多个套接字。如果你想知道的话，那么它就会告诉你哪个套接字准备读，哪个又准备写，哪个套接字又发生了例外 (exception)。
闲话少说，下面是 select()：
int select(int numfds, fd_set *readfds, fd_set *writefds,fd_set *exceptfds, struct timeval *timeout);
这个函数监视一系列文件描述符，特别是 readfds、writefds 和 exceptfds。如果你想知道你是否能够从标准输入和套接字描述符 sockfd 读入数据，你只要将文件描述符 0 和 sockfd 加入到集合 readfds 中。参数 numfds 应该等于最高的文件描述符的值加1。在这个例子中，你应该设置该值为 sockfd+1。因为它一定大于标准输入的文件描述符 (0)。当函数 select() 返回的时候，readfds 的值修改为反映你选择的哪个文件描述符可以读。你可以用下面讲到的宏 FD_ISSET() 来测试。在我们继续下去之前，让我来讲讲如何对这些集合进行操作。每个集合类型都是 fd_set。下面有一些宏来对这个类型进行操作：
FD_ZERO(fd_set *set) – 清除一个文件描述符集合
　　FD_SET(int fd, fd_set *set) - 添加fd到集合
　　FD_CLR(int fd, fd_set *set) – 从集合中移去fd
　　FD_ISSET(int fd, fd_set *set) – 测试fd是否在集合中
最后，是有点古怪的数据结构 struct timeval。有时你可不想永远等待别人发送数据过来。也许什么事情都没有发生的时候你也想每隔96秒在终端上打印字符串"Still Going..."。这个数据结构允许你设定一个时间，如果时间到了，而 select() 还没有找到一个准备好的文件描述符，它将返回让你继续处理。
数据结构 struct timeval 是这样的：
struct timeval {
　　 int tv_sec;
　　 int tv_usec;
　　 };
只要将tv_sec 设置为你要等待的秒数，将 tv_usec 设置为你要等待的微秒数就可以了。是的，是微秒而不是毫秒。1,000微秒等于1毫秒，1,000 毫秒等于1秒。也就是说，1秒等于1,000,000微秒。为什么用符号"usec" 呢? 字母"u" 很象希腊字母Mu，而Mu 表示"微" 的意思。当然，函数返回的时候 timeout 可能是剩余的时间，之所以是可能，是因为它依赖于你的 Unix 操作系统。哈！我们现在有一个微秒级的定时器！别计算了，标准的Unix 系统的时间片是100毫秒，所以无论你如何设置你的数据结构 struct timeval，你都要等待那么长的时间。

还有一些有趣的事情：如果你设置数据结构 struct timeval 中的数据为 0，select() 将立即超时，这样就可以有效地轮询集合中的所有的文件描述符。如果你将参数 timeout 赋值为 NULL，那么将永远不会发生超时，即一直等到第一个文件描述符就绪。最后，如果你不是很关心等待多长时间，那么就把它赋为 NULL 吧。

下面的代码演示了在标准输入上等待 2.5 秒：
#define STDIN 0
main()
{
　　struct timeval tv;
　　fd_set readfds;
      tv.tv_sec = 2;
　　tv.tv_usec = 500000;
      FD_ZERO(&readfds);
　　FD_SET(STDIN,&readfds);

　　select(STDIN+1,&readfds, NULL, NULL,&tv);
      if (FD_ISSET(STDIN,&readfds))
　　printf("A key was pressed!\n");
　　else
　　printf("Timed out.\n");
}
如果你是在一个 line buffered 终端上，那么你敲的键应该是回车 (RETURN)，否则无论如何它都会超时。
现在，你可能回认为这就是在数据报套接字上等待数据的方式--你是对的：它可能是。有些 Unix 系统可以按这种方式，而另外一些则不能。

最后一件关于 select() 的事情：如果你有一个正在侦听 (listen()) 的套接字，你可以通过将该套接字的文件描述符加入到 readfds 集合中来看是否有新的连接。