我的网络编程学习之路——基本的TCP套接字API

来源：互联网发布：天戏网络编辑：程序博客网时间：2024/06/05 06:12

1.1 概述

在这个篇章里面主要讲解编写一个完整的TCP客户/服务器程序所需要的基本套接字函数。这些API包括socket、connect、bind、listen和accept。

1.2 socket 函数

为了执行网络I/O，一个进程必须做的第一件事情就是调用socket函数，指定期望的通信协议类型（使用IPv4的TCP、使用IPv6的UDP、Unix域字节流协议等）。

#include <sys/socket.h>int socket(int family, int type, int protocol);返回：若成功则为非负描述符，若出错则为-1

其中family参数指明协议族，它是表1.2.1中所示的某个常值。该参数也往往被称为协议域。

表1.2.1 family常值family说明AF_INETIPv4协议AF_INET6IPv6协议AF_LOCALUnix域协议AF_ROUTE路由套接字AF_KEY密钥套接字

type参数指明套接字类型，它是表1.2.2中所示的某个常值。
表1.2.2 type常值type说明SOCK_STREAM字节流套接字SOCK_DGRAM数据报套接字SOCK_SEQPACKET有序分组套接字SOCK_RAW原始套接字protocol参数应设置为表1.2.3的某个需要类型常值，或者设为0，以选择所给定family和type组合的系统默认值。

表1.2.3 protocol常值protocol说明IPPROTO_TCPTCP传输协议IPPROTO_UDPUDP传输协议IPPROTO_SCTPSCTP传输协议
并非所有套接字family与type的组合都是有效的，下面给出了一些有效的组合和对应的真正协议。其中标为“是”的项也是有效的，但还没找到便捷的缩略词。而空白项则是无效组合。

socket函数在成功时返回一个小的非负整数值，它与文件描述符类似，我们把它称为套接字描述符，简称sockfd。为了得到这个套接字描述符，我们只是指定了协议族（IPv4、IPv6或Unix）和套接字类型（字节流、数据报或原始套接字）。我们并没有指定本地协议地址或远程协议地址。

1.3 connect 函数

TCP客户用connect 函数来建立与TCP服务器的连接。

#include <sys/socket.h>int connect(int sockfd, const struct sockaddr *servaddr, socklen_t addrlen);返回：若成功则为0，若出错则为-1

sockfd是由socket函数返回的套接字描述符，第二个、第三个参数分别是一个指向套接字地址结构的指针和该结构的大小。套接字的地址结构必须含有服务器的IP地址和端口号。

客户在调用函数connect前不必非得调用bind函数（之后我们会介绍该函数），因为如果需要的话，内核会确定源IP地址，并选择一个临时端口号作为源端口。

如果是TCP套接字，调用connect函数将激发TCP的三路握手过程，而且仅在连接建立或出错时才返回，其中出错返回可能有以下几种情况。

若TCP客户没有收到SYN分节的响应，则返回ETIMEDOUT错误。举例来说，调用connect函数时，4.4BSD内核发送一个SYN，若无响应则等待6s后再发送一个，若扔无响应则等待24s后再发送。若总共等了75s后仍未收到响应则返回本错误。有些系统提供对超时值的管理控制。
若对客户的SYN的响应是RST（表示复位），则表明该服务器主机在我们指定的端口上没有进程在等待与之连接（例如服务器进程也许没在运行）。这是一种硬错误，客户一接收到RST就马上返回ECONNREFUSED错误。（RST是TCP在发生错误时发送的一种TCP分节。产生RST的三个条件是：目的地为某端口的SYN到达，然而该端口上并没有正在监听的服务器；TCP想取消一个已有连接；TCP接收到一个根本不存在的连接上的分节。）
若客户发出的SYN在中间的某个路由器上引发了一个"destination unreachable"（目的地不可达）ICMP错误，则认为是一种软错误。客户主机内核保存该信息，并按第一种情况中所述的时间间隔继续发送SYN。若在某个规定的时间后仍未收到响应，则把保存的消息（即ICMP错误）作为EHOSTUNREACH或ENETUNREACH错误返回给进程。以下两种情形也是有可能的：一是按照本地系统的转发表，根本没有到达远程系统的路径；二是connect调用根本不等待就返回。

connect函数导致当前套接字从CLOSED状态（该套接字自从由socket函数创建以来一直处于的状态）转移到SYN_SENT状态，若成功则在转移到ESTABLISHED状态。若connect失败则该套接字不再可用，必须关闭，我们不能对这样的套接字再次调用connect函数。

1.4 bind 函数

bind函数把一个本地协议地址赋予一个套接字。对于网际网协议，协议地址是32位的IPv4地址或128位的IPv6地址与16位的TCP或UDP端口号的组合。

#include <sys/socket.h>int bind(int sockfd, const struct sockaddr *myaddr, socklen_t addrlen);返回：若成功则为0，若出错则为-1

第二个参数是一个指向特定于协议的地址结构的指针，第三个参数是该地址结构的长度。对于TCP，调用bind函数可以指定一个端口，或指定一个IP地址，也可以两者都指定，还可以都不指定。

服务器在启动时捆绑它们的众所周知端口。如果一个TCP客户或服务器未曾调用bind捆绑一个端口，当调用connect或listen时，内核就要为相应的套接字选择一个临时端口。让内核来选择临时端口对于TCP客户来说是正常的，除非应用需要一个预留端口；然而对于TCP服务器来说去极为罕见，因为服务器是通过它们众所周知端口被大家认识的。
进程可以把一个特定的IP地址捆绑到它的套接字上，不过这个IP地址必须属于其所在主机的网络接口之一。对于TCP客户，这就为在该套接字上发送的IP数据报指派了源IP地址。对于TCP服务器，这就限定该套接字只接收那些目的地为这个IP地址的客户连接。TCP客户通常不把IP地址捆绑到它的套接字上。当连接套接字时，内核将根据所用外出网络接口来选择源IP地址，而所用外出接口则取决于到达服务器所需的路径。如果TCP服务器没有把IP地址捆绑到它的套接字上，内核就把客户发送的SYN的目的IP地址作为服务器的源IP地址。

正如我们所说，调用bind可以指定IP地址或端口，可以两者都指定，也可以都不指定。

如果指定端口号为0，那么内核就在bind被调用时选择一个临时端口。然而如果指定IP地址为通配地址，那么内核将等到套接字已连接（TCP）或已在套接字上发出数据报（UDP）时才选择一个本地IP地址。

对IPv4来说，通配地址由常值INADDR_ANY来指定，其值一般为0。它告知内核去选择IP地址。

struct sockaddr_in servaddr;servaddr.sin_addr.a_addr = htonl(INADDR_ANY);

对于IPv6来说，128位的IPv6地址是存放在一个结构中的。系统预先分配inaddr_any变量并将其初始化为常值IN6ADDR_ANT_INIT。

struct sockaddr_in6 serv;serv.sin6_addr = in6addr_any;

如果让内核来为套接字选择一个临时端口号，那么必须注意，函数bind并不返回所选择的值。为了得到内核所选择的这个临时端口值，必须调用函数getsockname来返回协议地址。

从bind函数返回的一个常见错误是EADDRINUSE（地址以使用）。

1.5 listen 函数

listen函数仅由TCP服务器调用，它做两件事情。

当socket函数创建一个套接字时，它被假设为一个主动套接字也就是说，它是一个将调用connect发起连接的客户套接字。listen函数把一个未连接的套接字转换成一个被动套接字，指示内核应接受指向该套接字的连接请求。调用listen导致套接字从CLOSED状态转换到LISTEM状态。
本函数的第二个参数规定了内核应该为相应套接字排队的最大连接个数。

#include <sys/socket.h>int listen(int sockfd, int backlog);返回：若成功则为0，若出错则为-1

本函数通常应该在调用socket和bind这两个函数之后，并在调用accept函数之前调用。

为了理解其中的backlog参数，我们必须认识到内核为任何一个给定的监听套接字维护两个队列：

未完成连接队列，每个这样的SYN分节对应其中一项：已由某个客户发出并到达服务器，而服务器正在等待完成相应的TCP三路握手过程。这些套接字处于SYN_RCVD状态。
已完成连接队列，每个已完成TCP三路握手过程的客户对应其中一项。这些套接字处于ESTABLISHED

每当在未完成连接队列中创建一项时，来自监听套接字的参数就复制到即将建立的连接中。连接的创建机制是完全自动的，无需服务器进程插手。下面展示了用这两个队列建立连接时所交换的分组。

当来自客户的SYN到达时，TCP在未完成连接队列中创建一个新项，然后响应以三路握手的第二个分节：服务器的SYN响应，其中捎带对客户SYN的ACK。这一项一直保留在未完成队列中，直到三路握手的第三个分节（客户对服务器SYN的ACK）到达或者该项超时为止。如果三路握手正常完成，该项就从未完成连接队列移到以完成连接队列的队尾。当进程调用accept是，已完成连接队列中的队头项将返回给进程，或者如果该队列为空，那么进程将被投入睡眠，直到TCP在该队列中放入一项才唤醒它。

关于这两个队列的处理，以下几点需要考虑。

listen函数的backlog参数曾被规定为这两个队列总和的最大值。
不要把backlog定义为0，因为不同的实现对此有不同的解释。如果你不想让任何客户连接到你的监听套接字上，那就关掉该监听套接字。
在三路握手正常完成的前提下（也就是说没有丢失分节，从而没有重传），未完成连接队列中的任何一项在其中的存留时间就是一个RTT，而RTT的值取决于特定的客户与服务器。
指定一个比内核能够支持的值还要大的backlog也是可接受的，因为内核应该悄然把所指定的偏大值截成自身支持的最大值，而不返回错误。
指定较大backlog值得理由在于：随着客户SYN分节的到达，未完成连接队列中的项数可能增长，它们等着三路握手的完成。
当一个客户SYN到达时，若这些队列时满的，TCP就忽略该分节，也就是不发送RST。这么做是因为：这种情况是暂时的，客户TCP将重发SYN，期望不久就能在这些队列中找到可用空间。要是服务器TCP立即响应以一个RST，客户的connect调用就会立即返回一个错误，强调应用进程处理这种情况，而不是让TCP的正常重传机制来处理。另外，客户无法区别响应的RST究竟意味着“该端口没有服务器在监听”，还是意味着“该端口有服务器在监听，不过它的队列满了”。
在三路握手完成之后，但在服务器调用accept之前到达的数据应由服务器TCP排队，最大数据为相应已连接套接字的接收缓冲区大小。

1.6 accept 函数

accept函数由TCP服务器调用，用于从已完成连接队列队头返回下一个已完成连接。如果已完成连接队列为空，那么进程被投入睡眠（假设套接字为默认的阻塞方式）。

#include <sys/socket.h>int accept(int sockfd, struct sockaddr *cliaddr, socklen_t *addrlen);返回：若成功则为非负描述符，若出错则为-1

参数cliaddr和addrlen用来返回已连接的对端进程（客户）的协议地址。addrlen是值-结果参数：调用前，我们将由*addrlen所引用的整数值置为由cliaddr所指的套接字地址结构的长度，返回时，该整数值即为由内核存放在该套接字地址结构内的确切字节数。

如果accept成功，那么其返回值就是由内核自动生成的一个全新描述符，代表与所返回客户的TCP连接。我们称它的第一个参数为监听套接字描述符（由socket创建，随后用作bind和listen的第一个参数的描述符），称它的返回值为已连接套接字。区分这两个套接字非常重要。一个服务器通常仅仅创建一个监听套接字，它在服务器的生命周期内一直存在。内核为每个服务器进程接受的客户连接创建一个已连接套接字（也就是说对于它的TCP三路握手过程已经完成）。当服务器完成对某个给定客户的服务时，相应的已连接套接字就被关闭。

本函数最多返回三个值：一个既可能是全新套接字描述符也可能是出错指示的整数、客户进程的协议地址以及该地址的大小。如果我们对客户的协议地址不感兴趣，那么可以把cliaddr和addrlen均置为空指针。

1.7 基本TCP客户/服务器程序的套接字函数

阅读全文

0 0