Linux C下socket编程API简介

来源:互联网 发布:easing.js下载 编辑:程序博客网 时间:2024/05/16 03:07
1. 网络字节序
         内存中的多字节数据相对于内存地址有大端和小端之分,磁盘文件中的多字节数据相对于文件
中的偏移地址也有大端小端之分。网络数据流同样有大端小端之分,那么如何定义网络数据流的地
址呢?发送主机通常将发送缓冲区中的数据按内存地址从低到高的顺序发出,接收主机把从网络上
接到的字节依次保存在接收缓冲区中,也是按内存地址从低到高的顺序保存,因此,网络数据流的
地址应这样规定:先发出的数据是低地址,后发出的数据是高地址。

        TCP/IP协议规定,网络数据流应采用大端字节序,即低地址高字节。例如上一节的UDP段格式,
地址0-1是16位的源端口号,如果这个端口号是1000(0x3e8),则地址0是0x03,地址1是0xe8,也
就是先发0x03,再发0xe8,这16位在发送主机的缓冲区中也应该是低地址存0x03,高地址存0xe8。
但是,如果发送主机是小端字节序的,这16位被解释成0xe803,而不是1000。因此,发送主机把
1000填到发送缓冲区之前需要做字节序的转换。同样地,接收主机如果是小端字节序的,接到16位
的源端口号也要做字节序的转换。如果主机是大端字节序的,发送和接收都不需要做转换。同理,

32位的IP地址也要考虑网络字节序和主机字节序的问题。


        为使网络程序具有可移植性,使同样的C代码在大端和小端计算机上编译后都能正常运行,可以
调用以下库函数做网络字节序和主机字节序的转换。

#include <arpa/inet.h>
uint32_t htonl(uint32_t hostlong);
uint16_t htons(uint16_t hostshort);
uint32_t ntohl(uint32_t netlong);
uint16_t ntohs(uint16_t netshort);

        这些函数名很好记,h表示host,n表示network,l表示32位长整数,s表示16位短整数。例如
htonl表示将32位的长整数从主机字节序转换为网络字节序,例如将IP地址转换后准备发送。如果主
机是小端字节序,这些函数将参数做相应的大小端转换然后返回,如果主机是大端字节序,这些函
数不做转换,将参数原封不动地返回。


2. socket地址的数据类型及相关函数

        sockaddr_in中的成员struct in_addr sin_addr表示32位的IP地址。但是我们通常用点分十进
制的字符串表示IP地址,以下函数可以在字符串表示和in_addr表示之间转换。

字符串转in_addr的函数:

#include <arpa/inet.h>
int inet_aton(const char *strptr, struct in_addr *addrptr);
in_addr_t inet_addr(const char *strptr);
int inet_pton(int family, const char *strptr, void *addrptr);

in_addr转字符串的函数:

char *inet_ntoa(struct in_addr inaddr);
const char *inet_ntop(int family, const void *addrptr, char *strptr, size_t len);

其中inet_pton和inet_ntop不仅可以转换IPv4的in_addr,还可以转换IPv6的in6_addr,因此函数接
口是void *addrptr。


3.其它

int socket(int family, int type, int protocol);

        socket()打开一个网络通讯端口,如果成功的话,就像open()一样返回一个文件描述符,应用
程序可以像读写文件一样用read/write在网络上收发数据,如果socket()调用出错则返回-1。对于
IPv4,family参数指定为AF_INET。对于TCP协议,type参数指定为SOCK_STREAM,表示面向流的传输
协议。如果是UDP协议,则type参数指定为SOCK_DGRAM,表示面向数据报的传输协议。protocol参数
的介绍从略,指定为0即可。

int bind(int sockfd, const struct sockaddr *myaddr, socklen_t addrlen);

        服务器程序所监听的网络地址和端口号通常是固定不变的,客户端程序得知服务器程序的地址
和端口号后就可以向服务器发起连接,因此服务器需要调用bind绑定一个固定的网络地址和端口号
。bind()成功返回0,失败返回-1。

        bind()的作用是将参数sockfd和myaddr绑定在一起,使sockfd这个用于网络通讯的文件描述符
监听myaddr所描述的地址和端口号。前面讲过,struct sockaddr *是一个通用指针类型,myaddr参
数实际上可以接受多种协议的sockaddr结构体,而它们的长度各不相同,所以需要第三个参数
addrlen指定结构体的长度。我们的程序中对myaddr参数是这样初始化的:

bzero(&servaddr, sizeof(servaddr));
servaddr.sin_family = AF_INET;
servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
servaddr.sin_port = htons(SERV_PORT);

        首先将整个结构体清零,然后设置地址类型为AF_INET,网络地址为INADDR_ANY,这个宏表示本
地的任意IP地址,因为服务器可能有多个网卡,每个网卡也可能绑定多个IP地址,这样设置可以在
所有的IP地址上监听,直到与某个客户端建立了连接时才确定下来到底用哪个IP地址,端口号为
SERV_PORT,我们定义为8000。

int listen(int sockfd, int backlog);

        典型的服务器程序可以同时服务于多个客户端,当有客户端发起连接时,服务器调用的accept
()返回并接受这个连接,如果有大量的客户端发起连接而服务器来不及处理,尚未accept的客户端
就处于连接等待状态,listen()声明sockfd处于监听状态,并且最多允许有backlog个客户端处于连
接待状态,如果接收到更多的连接请求就忽略。listen()成功返回0,失败返回-1。

int accept(int sockfd, struct sockaddr *cliaddr, socklen_t *addrlen);

        三方握手完成后,服务器调用accept()接受连接,如果服务器调用accept()时还没有客户端的
连接请求,就阻塞等待直到有客户端连接上来。cliaddr是一个传出参数,accept()返回时传出客户
端的地址和端口号。addrlen参数是一个传入传出参数(value-result argument),传入的是调用
者提供的缓冲区cliaddr的长度以避免缓冲区溢出问题,传出的是客户端地址结构体的实际长度(有
可能没有占满调用者提供的缓冲区)。如果给cliaddr参数传NULL,表示不关心客户端的
地址。

        我们的服务器程序结构是这样的:

while (1) {
cliaddr_len = sizeof(cliaddr);
connfd = accept(listenfd, (struct sockaddr *)&cliaddr, &cliaddr_len);
n = read(connfd, buf, MAXLINE);
......
close(connfd);
}

        整个是一个while死循环,每次循环处理一个客户端连接。由于cliaddr_len是传入传出参数,
每次调用accept()之前应该重新赋初值。accept()的参数listenfd是先前的监听文件描述符,而
accept()的返回值是另外一个文件描述符connfd,之后与客户端之间就通过这个connfd通讯,最后
关闭connfd断开连接,而不关闭listenfd,再次回到循环开头listenfd仍然用作accept的参数。
accept()成功返回一个文件描述符,出错返回-1。

        由于客户端不需要固定的端口号,因此不必调用bind(),客户端的端口号由内核自动分配。注
意,客户端不是不允许调用bind(),只是没有必要调用bind()固定一个端口号,服务器也不是必须
调用bind(),但如果服务器不调用bind(),内核会自动给服务器分配监听端口,每次启动服务器时
端口号都不一样,客户端要连接服务器就会遇到麻烦。

int connect(int sockfd, const struct sockaddr *servaddr, socklen_t addrlen);

        客户端需要调用connect()连接服务器,connect和bind的参数形式一致,区别在于bind的参数
是自己的地址,而connect的参数是对方的地址。connect()成功返回0,出错返回-1。


        现在做一个测试,首先启动server,然后启动client,然后用Ctrl-C使server终止,这时马上
再运行server,结果是:

bind error: Address already in use

        这是因为,虽然server的应用程序终止了,但TCP协议层的连接并没有完全断开,因此不能再次
监听同样的server端口。

        在server的TCP连接没有完全断开之前不允许重新监听是不合理的,因为,TCP连接没有完全断
开指的是connfd(127.0.0.1:8000)没有完全断开,而我们重新监听的是listenfd(0.0.0.0:8000
),虽然是占用同一个端口,但IP地址不同,connfd对应的是与某个客户端通讯的一个具体的IP地
址,而listenfd对应的是wildcard address。解决这个问题的方法是使用setsockopt()设置socket
描述符的选项SO_REUSEADDR为1,表示允许创建端口号相同但IP地址不同的多个socket描述符。在
server代码的socket()和bind()调用之间插入如下代码:

int opt = 1;
setsockopt(listenfd, SOL_SOCKET, SO_REUSEADDR, &opt, sizeof(opt));




就是以上这些了,写得比较仓促,格式很乱,逻辑也不是很清楚,见谅!

(我的第一篇博文终于完成了,呵呵,虽然有抄袭的嫌疑)
原创粉丝点击