Linux IPC之Socket网络编程基础篇

来源：互联网发布：工业视觉软件编辑：程序博客网时间：2024/05/21 05:39

UNIX IPC工具使用总结里介绍了socket是一种用于通信的IPC工具。它允许位于同一主机或跨主机上的应用程序之间交换数据。第一个被广泛接受的socket API实现于1983年，出现在4.2BSD中，实际上这组API已经被移植到了所有UNIX实现以及大多数操作系统上。

概述

在一个典型的C/S场景中，应用程序使用socket进行通信的方式如下：

各个应用程序创建一个socket。socket是一个允许通信的“设备”，两个应用程序都需要用到它。
服务器将自己的socket绑定到一个众所周知的地址上，使得客户端能够定位到它的位置。

// 使用socket系统调用，能够创建一个socket，它返回一个用来在后续系统调用中引用该socket的文件描述符fd = socket(domain, type, protocol);

通信domain

socket存在于一个通信domain中，它确定：

识别出一个socket的方法，即，socket“地址”的格式。
通信范围，即，在位于同一主机上的应用程序之间，还是位于跨主机的应用程序之间。

现代操作系统至少支持下列domain：

UNIX（AF_UNIX）domain
允许在同一主机上的应用程序之间进行通信。

POSIX.1g使用AF_LOCAL作为AF_UNIX的同义词，但是SUSv3并没有使用这个名称。

IPv4（AF_INET）domain
允许在使用IPv4网络连接起来的主机上的应用程序之间进行通信。
IPv6（AF_INET6）domain
允许在使用IPv6网络连接起来的主机上的应用程序之间进行通信。

尽管IPv6被设计成了IPv4的接任者，但目前后一种协议仍然是使用最广的协议。

总结

domain 执行的通信应用程序间的通信地址格式地址结构 AF_UNIX 内核中同一主机路径名 sockaddr_un AF_INET IPv4 IPv4连接起来的主机 32位IPv4地址＋ 16位端口号 sockaddr_in AF_INET6 IPv6 IPv6连接起来的主机 128位IPv6地址＋ 16位端口号 sockaddr_in6

socket类型

每个socket实现都至少提供了两种socket：流和数据报。这两种socket类型在UNIX和Internet domain中都得到了支持。

属性流数据报可靠的传递？ YES NO 消息边界保留？ NO YES 面向连接？ YES NO

流socket（SOCK_STREAM）

流socket提供了一个可靠的双向的字节流通信信道。

可靠的
表示可以保证发送者传输的数据会完整无缺地到达接收应用程序（假设网络连接和接收者都不会崩溃），或收到一个传输失败的通知。
双向的
表示数据可以在两个socket之间的任意方向上传输。
字节流
表示与管道一样不存在消息边界的概念。

一个流socket类似于使用一对允许在两个应用程序之间进行双向通信的管道，它们之间的差别在于socket（Internet domain）允在在网络上进行通信。

数据报socket（SOCK_DGRAM）

数据报socket允许数据以被称为数据报的消息的形式进行交换。在数据报socket中，消息边界得到了保留，但是数据传输是不可靠的，消息的到达可能是无序的，重复的，或者根本就无法达到。

数据报socket是更一般的无连接socket。与流socket不同，一个数据报socket在使用时无需与另一个socket连接。
注意：数据报socket可以与另一个socket连接，但其语义与连接的流socket是不同的。

对比

在Internet domain中：

类型协议名称流socket 传输控制协议TCP TCP socket 数据报socket 数据报协议UDP UDP socket

socket系统调用

关键的socket系统调用包括：

系统调用描述 socket() 创建一个新的socket bind() 将一个socket绑定到一个地址上。通常，服务器需要使用这个调用来将其socket绑定到一个众所周知的地址上，使得客户端能够定位到该socket上。 listen() 允许一个流socket接收来自其他socket的接入连接。 accept() 在一个监听socket上接收来自一个对等应用程序的连接，并可选地返回对等socket的地址。 connet() 建立与另一个socket之间的连接

在大多数Linux架构上（除了Alpha和IA-64），所有这些socket系统调用实际上被实现成了通过单个系统调用socketcall()进行多路复用的库函数（最初的时候）。但是，上述函数都被称为系统调用，是因为它们在最初的BSD实现，以及其他很多同时代的UNIX实现上，是被作为系统调用实现的。

socket I/O可以使用传统的read()和write()系统调用使用，或使用一组socket特有的系统调用，如，send()，recv()，sendto()，recvfrom()来完成。

注意：在默认情况下，这些系统调用在I/O操作无法被立即完成时会阻塞。通过使用fcntl()的F_SETFL操作来启用O_NONBLOCK打开文件状态标记可以执行非阻塞I/O。

流socket注意事项

流socket的运作与电话系统类似。具体流程可以参考TCP连接建立和终止及TCP状态转换。在大多数使用流socket的应用程序中，服务器会执行被动打开，而客户端会执行主动式打开。

#include <sys/socket.h>// return file descriptor on success, or -1 on errorint socket(int domain, int type, int protocol);// return 0 on success, or -1 on errorint bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);// 通用的地址结构（所有domain特定的地址结构模版），用途是，将各种domain特定的地址结构转换成单个类型，以供socket系统调用中的各个参数适用struct sockaddr {    sa_family_t sa_family;   /* Address family (AF_* constant) */    char        sa_data[14]; /* Socket address (size varies according to socket domain) */}// return 0 on success, or -1 on errorint listen(int sockfd, int backlog);// return file descriptor on success, or -1 on errorint accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);// return 0 on success, or -1 on errorint connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

socket()接口中，protocol参数通常为0，在裸socket（SOCK_RAW）中，会将protocol指定为IPPROTO_RAW。

从内核2.6.27开始，Linux为type参数提供了第二种用途，即允许两个非标准的标记与socket类型取OR。

除了将一个服务器的socket绑定到一个众所周知的地址，对于一个Internet domain socket来讲，服务器可以不调用bind()而直接调用listen()，这将会导致内核为该socket选择一个临时端口。之后服务器可以使用getsockname()来获取socket的地址。
无法在一个已连接的socket（即，已经成功执行connect()的socket，或由accept()返回的socket）上执行listen()。
理解backlog参数的用途。

客户端可能会在服务器调用accept()之前调用connect()，这将会产生一个未决的连接。内核必须要记录所有未决的连接请求的相关信息，这样后续的accept()就能够处理这些请求。backlog参数允许限制这种未决连接的数量。在这个限制内的连接请求会立即成功，之外的连接请求就会阻塞直到一个未决的连接被accept()接受，并从未决连接队列删除为止。

SUSv3规定实现应该通过在<sys/socket.h>中定义SOMAXCONN常量来发布这个限制。在Linux上，这个常量的值被定义为128。但是，从2.4.25内核起，Linux允许在运行时通过/proc/sys/net/core/somaxconn文件来调整这个限制。

在最初的BSD socket实现中，backlog的上限是5，并且在较早的代码中可以看到这个数值。但是，所有现代实现允许为backlog指定更高的值，这对于使用TCP socket服务大量客户的网络服务器来讲是由必要的。

accept()通过文件描述符sockfd监听流socket上接受一个接入连接，如果在调用accept()时不存在未决的连接，那么调用就会阻塞直到有连接请求到达为止。传入accept()的剩余参数会返回对端socket的地址。如果不关心对等socket的地址，可以将addr和addrlen分别指定为NULL和0（后续可以通过getpeername()）来获取对端的地址。

理解accept的关键：它会创建一个新socket，并且正是这个新socket会与执行connect()的对等socket进行连接。accept()返回的函数结果是已连接的socket的文件描述符。
从内核2.6.28开始，Linux支持一个新的非标准系统调用accept4()。这个系统调用执行的任务与accept()相同，但是，支持一个额外的参数flags，而这个参数可以用来改变系统调用的行为。目前系统支持两个标记：SOCK_CLOEXEC和SOCK_NONBLOCK。

如果connect()失败并且希望重新进行连接，那么SUSv3规定完成这个任务的可移植的方法是关闭这个socket，创建一个新socket，在该新socket上重新进行连接。

数据报socket注意事项

数据报socket的运作类似于邮政系统。

// return number of bytes received, 0 on EOF, or -1 on errorssize_t recvfrom(int sockfd, void *buffer, size_t length, int flags, struct sockaddr *src_addr, socklen_t *addrlen);// return number of bytes sent, or -1 on errorssize_t sendto(int sockfd, const void *buffer, size_t length, int flags, const struct sockaddr *dest_addr, socklen_t addrlen);

不管length的参数值是什么，recvfrom()只会从一个数据报socket中读取一条消息。如果消息的大小超过了length字节，那么消息会被静默地截断为length字节。
在Linux上可以使用sendto()发送长度为0的数据报，但不是所有的UNIX实现都允许这样做。
尽管数据报socket是无连接的，但在数据报socket上应用connect()仍然是有效的。在数据报socket上调用connect()会导致内核记录这个socket()的对等socket的地址。

当一个数据报socket已连接之后：
1. 数据报的发送可在socket上使用write()或send()来完成，与sendto()一样，每个write()会发送一个独立的数据报。
2. 在这个socket上只能读取由对等socket发送的数据报。

注意，connect()的作用对数据报socket是不对称的。通过再发起一个connect()可以修改一个已连接的数据报socket的对等socket。

总结

为了一个数据报socket设置一个对等socket，这种做法的一个明显优势是在该socket上传输数据时可以使用更简单的I/O系统调用，即，无需使用指定了dest_addr和addrlen参数的sendto()，而只需要使用write()即可。设置一个对等socket主要对那些需要单个对等socket发送多个数据报的应用程序是比较有用的。

在一些TCP/IP实践中，将一个数据报socket连接到一个对等socket能够带来性能上的提升。

0 0