Linux IPC之Socket网络编程基础篇

来源:互联网 发布:工业视觉软件 编辑:程序博客网 时间:2024/05/21 05:39

UNIX IPC工具使用总结 里介绍了socket是一种用于通信的IPC工具。它允许位于同一主机跨主机上的应用程序之间交换数据。第一个被广泛接受的socket API实现于1983年,出现在4.2BSD中,实际上这组API已经被移植到了所有UNIX实现以及大多数操作系统上。

概述

在一个典型的C/S场景中,应用程序使用socket进行通信的方式如下:

  • 各个应用程序创建一个socket。socket是一个允许通信的“设备”,两个应用程序都需要用到它。
  • 服务器将自己的socket绑定到一个众所周知的地址上,使得客户端能够定位到它的位置。
// 使用socket系统调用,能够创建一个socket,它返回一个用来在后续系统调用中引用该socket的文件描述符fd = socket(domain, type, protocol);

通信domain

socket存在于一个通信domain中,它确定:

  • 识别出一个socket的方法,即,socket“地址”的格式。
  • 通信范围,即,在位于同一主机上的应用程序之间,还是位于跨主机的应用程序之间。

现代操作系统至少支持下列domain:

  • UNIX(AF_UNIX)domain
    允许在同一主机上的应用程序之间进行通信。

POSIX.1g使用AF_LOCAL作为AF_UNIX的同义词,但是SUSv3并没有使用这个名称。

  • IPv4(AF_INET)domain
    允许在使用IPv4网络连接起来的主机上的应用程序之间进行通信。

  • IPv6(AF_INET6)domain
    允许在使用IPv6网络连接起来的主机上的应用程序之间进行通信。

尽管IPv6被设计成了IPv4的接任者,但目前后一种协议仍然是使用最广的协议。

总结

domain 执行的通信 应用程序间的通信 地址格式 地址结构 AF_UNIX 内核中 同一主机 路径名 sockaddr_un AF_INET IPv4 IPv4连接起来的主机 32位IPv4地址 + 16位端口号 sockaddr_in AF_INET6 IPv6 IPv6连接起来的主机 128位IPv6地址 + 16位端口号 sockaddr_in6

socket类型

每个socket实现都至少提供了两种socket流和数据报。这两种socket类型在UNIX和Internet domain中都得到了支持。

属性 流 数据报 可靠的传递? YES NO 消息边界保留? NO YES 面向连接? YES NO

流socket(SOCK_STREAM)

流socket提供了一个可靠的双向的字节流通信信道

  • 可靠的
    表示可以保证发送者传输的数据会完整无缺地到达接收应用程序(假设网络连接和接收者都不会崩溃),或收到一个传输失败的通知。

  • 双向的
    表示数据可以在两个socket之间的任意方向上传输。

  • 字节流
    表示与管道一样不存在消息边界的概念。

一个流socket类似于使用一对允许在两个应用程序之间进行双向通信的管道,它们之间的差别在于socket(Internet domain)允在在网络上进行通信。

数据报socket(SOCK_DGRAM)

数据报socket允许数据以被称为数据报的消息的形式进行交换。在数据报socket中,消息边界得到了保留,但是数据传输是不可靠的,消息的到达可能是无序的,重复的,或者根本就无法达到。

数据报socket是更一般的无连接socket。与流socket不同,一个数据报socket在使用时无需与另一个socket连接。
注意:数据报socket可以与另一个socket连接,但其语义与连接的流socket是不同的。

对比

在Internet domain中:

类型 协议 名称 流socket 传输控制协议TCP TCP socket 数据报socket 数据报协议UDP UDP socket

socket系统调用

关键的socket系统调用包括:

系统调用 描述 socket() 创建一个新的socket bind() 将一个socket绑定到一个地址上。通常,服务器需要使用这个调用来将其socket绑定到一个众所周知的地址上,使得客户端能够定位到该socket上。 listen() 允许一个流socket接收来自其他socket的接入连接。 accept() 在一个监听socket上接收来自一个对等应用程序的连接,并可选地返回对等socket的地址。 connet() 建立与另一个socket之间的连接

在大多数Linux架构上(除了Alpha和IA-64),所有这些socket系统调用实际上被实现成了通过单个系统调用socketcall()进行多路复用的库函数(最初的时候)。但是,上述函数都被称为系统调用,是因为它们在最初的BSD实现,以及其他很多同时代的UNIX实现上,是被作为系统调用实现的。

socket I/O可以使用传统的read()write()系统调用使用,或使用一组socket特有的系统调用,如,send()recv()sendto()recvfrom()来完成。

注意:在默认情况下,这些系统调用在I/O操作无法被立即完成时会阻塞。通过使用fcntl()F_SETFL操作来启用O_NONBLOCK打开文件状态标记可以执行非阻塞I/O。

流socket注意事项

流socket的运作与电话系统类似。具体流程可以参考TCP连接建立和终止及TCP状态转换 。在大多数使用流socket的应用程序中,服务器会执行被动打开,而客户端会执行主动式打开。

pic

#include <sys/socket.h>// return file descriptor on success, or -1 on errorint socket(int domain, int type, int protocol);// return 0 on success, or -1 on errorint bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);// 通用的地址结构(所有domain特定的地址结构模版),用途是,将各种domain特定的地址结构转换成单个类型,以供socket系统调用中的各个参数适用struct sockaddr {    sa_family_t sa_family;   /* Address family (AF_* constant) */    char        sa_data[14]; /* Socket address (size varies according to socket domain) */}// return 0 on success, or -1 on errorint listen(int sockfd, int backlog);// return file descriptor on success, or -1 on errorint accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);// return 0 on success, or -1 on errorint connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
  • socket()接口中,protocol参数通常为0,在裸socket(SOCK_RAW)中,会将protocol指定为IPPROTO_RAW。

从内核2.6.27开始,Linux为type参数提供了第二种用途,即允许两个非标准的标记与socket类型取OR。

  • 除了将一个服务器的socket绑定到一个众所周知的地址,对于一个Internet domain socket来讲,服务器可以不调用bind()而直接调用listen(),这将会导致内核为该socket选择一个临时端口。之后服务器可以使用getsockname()来获取socket的地址。

  • 无法在一个已连接的socket(即,已经成功执行connect()的socket,或由accept()返回的socket)上执行listen()。

  • 理解backlog参数的用途。

  1. 客户端可能会在服务器调用accept()之前调用connect(),这将会产生一个未决的连接。内核必须要记录所有未决的连接请求的相关信息,这样后续的accept()就能够处理这些请求。backlog参数允许限制这种未决连接的数量。在这个限制内的连接请求会立即成功,之外的连接请求就会阻塞直到一个未决的连接被accept()接受,并从未决连接队列删除为止。

  2. SUSv3规定实现应该通过在<sys/socket.h>中定义SOMAXCONN常量来发布这个限制。在Linux上,这个常量的值被定义为128。但是,从2.4.25内核起,Linux允许在运行时通过/proc/sys/net/core/somaxconn文件来调整这个限制。

  3. 在最初的BSD socket实现中,backlog的上限是5,并且在较早的代码中可以看到这个数值。但是,所有现代实现允许为backlog指定更高的值,这对于使用TCP socket服务大量客户的网络服务器来讲是由必要的。

pic

  • accept()通过文件描述符sockfd监听流socket上接受一个接入连接,如果在调用accept()时不存在未决的连接,那么调用就会阻塞直到有连接请求到达为止。传入accept()的剩余参数会返回对端socket的地址。如果不关心对等socket的地址,可以将addr和addrlen分别指定为NULL和0(后续可以通过getpeername())来获取对端的地址。

理解accept的关键:它会创建一个新socket,并且正是这个新socket会与执行connect()的对等socket进行连接。accept()返回的函数结果是已连接的socket的文件描述符。
从内核2.6.28开始,Linux支持一个新的非标准系统调用accept4()。这个系统调用执行的任务与accept()相同,但是,支持一个额外的参数flags,而这个参数可以用来改变系统调用的行为。目前系统支持两个标记:SOCK_CLOEXECSOCK_NONBLOCK

  • 如果connect()失败并且希望重新进行连接,那么SUSv3规定完成这个任务的可移植的方法是关闭这个socket,创建一个新socket,在该新socket上重新进行连接。

数据报socket注意事项

数据报socket的运作类似于邮政系统。

pic

// return number of bytes received, 0 on EOF, or -1 on errorssize_t recvfrom(int sockfd, void *buffer, size_t length, int flags, struct sockaddr *src_addr, socklen_t *addrlen);// return number of bytes sent, or -1 on errorssize_t sendto(int sockfd, const void *buffer, size_t length, int flags, const struct sockaddr *dest_addr, socklen_t addrlen);
  • 不管length的参数值是什么,recvfrom()只会从一个数据报socket中读取一条消息。如果消息的大小超过了length字节,那么消息会被静默地截断为length字节。

  • 在Linux上可以使用sendto()发送长度为0的数据报,但不是所有的UNIX实现都允许这样做。

  • 尽管数据报socket是无连接的,但在数据报socket上应用connect()仍然是有效的。在数据报socket上调用connect()会导致内核记录这个socket()的对等socket的地址。

当一个数据报socket已连接之后:
1. 数据报的发送可在socket上使用write()或send()来完成,与sendto()一样,每个write()会发送一个独立的数据报。
2. 在这个socket上只能读取由对等socket发送的数据报。

  • 注意,connect()的作用对数据报socket是不对称的。通过再发起一个connect()可以修改一个已连接的数据报socket的对等socket。

总结

为了一个数据报socket设置一个对等socket,这种做法的一个明显优势是在该socket上传输数据时可以使用更简单的I/O系统调用,即,无需使用指定了dest_addr和addrlen参数的sendto(),而只需要使用write()即可。设置一个对等socket主要对那些需要单个对等socket发送多个数据报的应用程序是比较有用的。

在一些TCP/IP实践中,将一个数据报socket连接到一个对等socket能够带来性能上的提升。

0 0