Linux IPC小结

来源：互联网发布：python 字符串编辑：程序博客网时间：2024/04/30 11:48

原文整理自网络：

IPC进程间通信(Inter-Process Communication)就是指多个进程之间相互通信，交换信息的方法。Linux IPC基本上都是从Unix平台上继承而来的。主要包括最初的Unix IPC，System V IPC以及基于Socket的IPC。另外，Linux也支持POSIX IPC。

System V,BSD,POSIX

System V是Unix操作系统最早的商业发行版之一。它最初由AT&T(American Telephone & Telegraph)开发，最早在1983年发布。System V主要发行了4个版本，其中SVR4(System V Release 4)是最成功的版本。BSD(Berkeley Software Distribution，有时也被称为Berkeley Unix)是加州大学于1977至1995年间开发的。在19世纪八十年代至九十年代之间，System V和BSD代表了Unix的两种主要的操作风格。它们的主要区别如下:

    系统                      System V           BSD
    root脚本位置            /etc/init.d/       /etc/rc.d/
    默认shell                 Bshell             Cshell
    文件系统数据            /etc/mnttab   /etc/mtab
    内核位置                  /UNIX       /vmUnix
    打印机设备          lp                  rlp
    字符串函数                memcopy       bcopy
    终端初始化设置文件   /etc/initab       /etc/ttys
    终端控制                  termio            termios

Linux系统的操作风格往往介于这两种风格之间。

POSIX(Portable Operating System Interface [for Unix])是由IEEE(Institute of Electrical and Electronics Engineers，电子电气工程协会)开发的。现有的大部分Unix都遵循POSIX标准，而Linux从一开始就遵循POSIX标准。

最初的Unix IPC

1、信号

信号是Unix/Linux系统在一定条件下生成的事件。信号是一种异步通信机制，进程不需要执行任何操作来等待信号的到达。信号异步通知接收信号的进程发生了某个事件，然后操作系统将会中断接收到信号的进程的执行，转而去执行相应的信号处理程序。

    (1)注册信号处理函数
        #include <signal.h>
        /*typedef void (*sighandler_t)(int); sighandler_t signal(int signum,sighandler_t handler);*/
        * void (*signal(int signum, void (*handler)(int)))(int);  //SIG_IGN && SIG_DFL
        * int sigaction(int signum, const struct sigaction *act,struct sigaction *oldact);

    (2)发送信号
        #include <signal.h>
        * int kill(pid_t pid,int sig); //#include <sys/types.h>
        * int raise(int sig);            //kill(getpid(),sig);
        * unsigned int alarm(unsigned int seconds); //(#include <unistd.h>) seconds秒后，向进程本身发送SIGALRM信号。

    (3)信号集
        信号集被定义为:typedef struct {unsigned long sig[_NSIG_WORDS];} sigset_t;
        * int sigaddset(sigset_t *set,int sig);
        * int sigemptyset(sigset_t *set);

2、管道(Pipe)

管道用来连接不同进程之间的数据流。

    (1)在两个程序之间传递数据的最简单的方法是使用popen()和pclose()函数:
        #include <stdio.h>
        FILE *popen(const char *command, const char *open_mode);
        int pclose(FILE *stream);
    popen()函数首先调用一个shell，然后把command作为参数传递给shell。这样每次调用popen()函数都需要启动两个进程；但是由于在Linux中，所有的参数扩展(parameter expansion)都是由shell执行的，这样command中包含的所有参数扩展都可以在command程序启动之前完成。

    (2)pipe()函数:
        #include <unistd.h>
        int pipe(int pipefd[2]);
    popen()函数只能返回一个管道描述符，并且返回的是文件流(file stream)，可以使用函数fread()和fwrite()来访问。pipe()函数可以返回两个管道描述符:pipefd[0]和pipefd[1]，任何写入pipefd[1]的数据都可以从pipefd[0]读回；pipe()函数返回的是文件描述符(file descriptor)，因此只能使用底层的read()和write()系统调用来访问。pipe()函数通常用来实现父子进程之间的通信。

    (3)命名管道:FIFO
        #include <sys/types.h>
        #include <sys/stat.h>
        int mkfifo(const char *fifo_name, mode_t mode);
    前面两种管道只能用在相关的程序之间，使用命名管道可以解决这个问题。在使用open()打开FIFO时，mode中不能包含O_RDWR。mode最常用的是O_RDONLY，O_WRONLY与O_NONBLOCK的组合。O_NONBLOCK影响了read()和write()在FIFO上的执行方式。

PS:要想查看库函数用法，最可靠的资料来自Linux manual page:

$sudo apt-get install manpages-dev

$man 3 function_name

System V IPC

System V IPC指的是AT&T在System V.2发行版中引入的三种进程间通信工具:(1)信号量，用来管理对共享资源的访问 (2)共享内存，用来高效地实现进程间的数据共享 (3)消息队列，用来实现进程间数据的传递。我们把这三种工具统称为System V IPC的对象，每个对象都具有一个唯一的IPC标识符(identifier)。要保证不同的进程能够获取同一个IPC对象，必须提供一个IPC关键字(IPC key)，内核负责把IPC关键字转换成IPC标识符。

System V IPC具有相似的语法，一般操作如下:

(1)选择IPC关键字，可以使用如下三种方式:

       a)IPC_PRIVATE。由内核负责选择一个关键字然后生成一个IPC对象并把IPC标识符直接传递给另一个进程。
       b)直接选择一个关键字。
       c)使用ftok()函数生成一个关键字。

(2)使用semget()/shmget()/msgget()函数根据IPC关键字key和一个标志flag创建或访问IPC对象。如果key是IPC_PRIVATE;或者key尚未与已经存在的IPC对象相关联且flag中包含IPC_CREAT标志，那么就会创建一个全新的IPC对象。

(3)使用semctl()/shmctl()/msgctl()函数修改IPC对象的属性。

(4)使用semctl()/shmctl()/msgctl()函数和IPC_RMID标志销毁IPC实例。

System V IPC为每个IPC对象设置了一个ipc_perm结构体并在创建IPC对象的时候进行初始化。这个结构体中定义了IPC对象的访问权限和所有者:

    struct ipc_perm{
       uid_t uid;   //所有者的用户id
       gid_t gid;   //所有者的组id
       uid_t cuid;  //创建者的用户id
       gid_t cgid;  //创建者的组id
       mode_t mode; //访问模式
       …
    };

shell中管理IPC对象的命令是ipcs、ipcmk和ipcrm。

1、信号量(Semaphores)

    System V的信号量集表示的是一个或多个信号量的集合。内核为每个信号量集维护一个semid_ds数据结构，而信号量集中的每个信号量使用一个无名结构体表示，这个结构体至少包含以下成员:
    struct{
        unsigned short semval;//信号量值，总是>=0
        pid_t sempid;  //上一次操作的pid
       …
    };

    #include <sys/types.h>
    #include <sys/ipc.h>
    #include <sys/sem.h>
    (1)创建或访问信号量
        * int semget(key_t key,int nsems,int flag);
    nsems指定信号量集中信号量的个数，如果只是获取信号量集的标识符(而非新建)，那么nsems可以为0。flag的低9位作为信号量的访问权限位，类似于文件的访问权限;如果flag中同时指定了IPC_CREAT和IPC_EXCL，那么如果key已与现存IPC对象想关联的话，函数将会返回EEXIST错误。例如，flag可以为IPC_CREAT|0666。

    (2)控制信号量集
        * int semctl(int semid,int semnum,int cmd,union semun arg);
    对semid信号量集合执行cmd操作;cmd常用的两个值是:SETVAL初始化第semnum个信号量的值为arg.val;IPC_RMID删除信号量。

    (3)对一个或多个信号量进行操作
        * int semop(int semid,struct sembuf *sops,unsigned nsops);
        * struct sembuf{
           unsigned short sem_num;  //信号量索引
           short   sem_op;     //对信号量进行的操作，常用的两个值为-1和+1，分别代表P、V操作
           short sem_flag;   //比较重要的值是SEM_UNDO:当进程结束时，相应的操作将被取消；同时，如果进程结束时没有释放资源的话，系统会自动释放
           };

2、共享内存

共享内存允许两个或多个进程共享一定的存储区，因为不需要拷贝数据，所以这是最快的一种IPC。

    #include <sys/ipc.h>
    #include <sys/shm.h>
    (1)创建或访问共享内存
        * int shmget(key_t key,size_t size,int shmflg);

(2)附加共享内存到进程的地址空间
* void *shmat(int shmid,const void *shmaddr,int shmflg);//shmaddr通常为NULL，由系统选择共享内存附加的地址;shmflg可以为SHM_RDONLY

(3)从进程的地址空间分离共享内存
* int shmdt(const void *shmaddr); //shmaddr是shmat()函数的返回值

    (4)控制共享内存
        * int shmctl(int shmid,int cmd,struct shmid_ds *buf);
        * struct shmid_ds{
           struct ipc_perm shm_perm;
           …
          };
    cmd的常用取值有:(a)IPC_STAT获取当前共享内存的shmid_ds结构并保存在buf中(2)IPC_SET使用buf中的值设置当前共享内存的shmid_ds结构(3)IPC_RMID删除当前共享内存

3、消息队列

消息队列保存在内核中，是一个由消息组成的链表。

    #include <sys/types.h>
    #include <sys/ipc.h>
    #include <sys/msg.h>
    (1)创建或访问消息队列
    * int msgget(key_t key,int msgflg);

    (2)操作消息队列
        * int msgsnd(int msqid,const void *msg,size_t nbytes,int msgflg);
    msg指向的结构体必须以一个long int成员开头，作为msgrcv()的消息类型，必须大于0。nbytes指的是msg指向结构体的大小，但不包括long int部分的大小
        * ssize_t msgrcv(int msqid,void *msg,size_t nbytes,long msgtype,int msgflg);
    如果msgtype是0，就返回消息队列中的第一个消息;如果是正整数，就返回队列中的第一个该类型的消息;如果是负数，就返回队列中具有最小值的第一个消息，并且该最小值要小于等于msgtype的绝对值。

    (3)控制消息队列
        * int msgctl(int msqid,int cmd,struct msqid_ds *buf);
        * struct msqid_ds{
           struct ipc_perm msg_perm;
           …
           };

Socket
　　套接字(Socket)是由Berkeley在BSD系统中引入的一种基于连接的IPC，是对网络接口(硬件)和网络协议(软件)的抽象。它既解决了无名管道只能在相关进程间单向通信的问题，又解决了网络上不同主机之间无法通信的问题。

　　套接字有三个属性:域(domain)、类型(type)和协议(protocol)，对应于不同的域，套接字还有一个地址(address)来作为它的名字。

　　域(domain)指定了套接字通信所用到的协议族，最常用的域是AF_INET，代表网络套接字，底层协议是IP协议。对于网络套接字，由于服务器端有可能会提供多种服务，客户端需要使用IP端口号来指定特定的服务。AF_UNIX代表本地套接字，使用Unix/Linux文件系统实现。

　　IP协议提供了两种通信手段:流(streams)和数据报(datagrams)，对应的套接字类型(type)分别为流式套接字和数据报套接字。流式套接字(SOCK_STREAM)用于提供面向连接、可靠的数据传输服务。该服务保证数据能够实现无差错、无重复发送，并按顺序接收。流式套接字使用TCP协议。数据报套接字(SOCK_DGRAM)提供了一种无连接的服务。该服务并不能保证数据传输的可靠性，数据有可能在传输过程中丢失或出现数据重复，且无法保证顺序地接收到数据。数据报套接字使用UDP协议。

　　一种类型的套接字可能可以使用多于一种的协议来实现，套接字的协议(protocol)属性用于指定一种特定的协议。

总结：

System V IPC API

1,消息队列

int ftok(const char *pathname, int prj_id);

int msgget(key_t key,int msgflag);

int msgsnd(int msqid,const void *msgp,size_t msgsz,int msgflg);

int msgrcv(int msqid,void *msgp,size_t msgsz,long msgtyp,int msgflg);

2,信号量

int semget(key_t key,int nsems,int semflag);

int semctl(int semid,int semnum,int cmd,…);

int semop(int semid,struct sembuf *sops,unsigned nsops,struct timespec *timeout);

3,共享内存

int shmget(key_t key,size_t size,int shmflag);

int shmctl(int shmid,int cmd,struct shmid_ds *buf);

POSIX IPC API

Linux下ipcs指令的用法详解。ipcs是Linux下显示进程间通信设施状态的工具。可以显示消息队列、共享内存和信号量的信息。对于程序员可能更有用些，普通的系统管理员一般用不到此指令。

（1）显示消息队列信息，

修改消息队列大小：

root：用户： /etc/sysctl.conf

kernel.msgmnb =4203520

kernel.msgmnb =3520

kernel.msgmni = 2878

保存后需要执行 sysctl -p ,然后重建所有消息队列

ipcs -q : 显示所有的消息队列

ipcs -qt : 显示消息队列的创建时间，发送和接收最后一条消息的时间

mas@[172.16.9.38:/mas]$ ipcs -qt

------ Message Queues Send/Recv/Change Times --------

msqid owner send recv change

65536 mas Not set Not set May 15 15:56:39

98305 mas May 15 15:59:22 May 15 15:59:22 May 15 15:56:39

ipcs -qp: 显示往消息队列中放消息和从消息队列中取消息的进程ID

mas@[172.16.9.38:/mas]$ ipcs -qp

------ Message Queues PIDs --------

msqid owner lspid lrpid

65536 mas 0 0

98305 mas 21941 21941

ipcs -q -i msgid: 显示该消息队列结构体中的消息信息：

mas@[172.16.9.38:/mas]$ ipcs -q -i 98305

Message Queue msqid=98305

uid=512 gid=500 cuid=512 cgid=500 mode=0600

cbytes=0 qbytes=4203520 qnum=0 lspid=21941 lrpid=21941

send_time=Thu May 15 16:00:19 2008

rcv_time=Thu May 15 16:00:19 2008

change_time=Thu May 15 15:56:39 2008

ipcs -ql : 显示消息队列的限制信息：

mas@[172.16.9.38:/mas]$ ipcs -ql

------ Messages: Limits --------

max queues system wide = 2878 //最大进程数

max size of message (bytes) = 8192 //队列中最大消息长度

default max size of queue (bytes) = 4203520

（2）ipcs指令的man手册中文翻译
ipcs 命令
用途
报告进程间通信设施状态。

语法
ipcs [ -m] [ -q] [ -s] [ -S] [ -P] [ -l] [ -a | -b -c-o -p -t] [ -T] [ -C CoreFile] [ -N Kernel ]

描述
ipcs 命令往标准输出写入一些关于活动进程间通信设施的信息。如果没有指定任何标志，ipcs 命令用简短格式写入一些关于当前活动消息队列、共享内存段、信号量、远程队列和本地队列标题。

列标题和在 ipcs 命令中的列的含义列在下面。圆括号内的字母表示导致对应的报头出现的标志。all 设计符表示始终显示报头。这些标志仅仅确定提供给每个设备何种信息。但它们并不确定将列出哪些设备。

T （all）设施的类型。共有三种设施类型：
q
消息队列
m
共享内存段
s
信号量
ID （all）设施项的标识。
KEY （all）用作 msgget 子例程、semget 子例程或者 shmget 子例程的参数的键构成了设施项。

注：当除去内存段时，共享内存段的密钥改变为 IPC_PRIVATE，直到所有附加在段上的进程和它拆离。
MODE （all）设施访问方式和标志。这种方式由 11 个字符组成，解释如下：
前两个字符如下所示：

R
如果进程在等待 msgrcv 系统调用。
S
如果进程在等待 msgsnd 系统调用。
D
如果有关的共享内存段被除去。当附加在段上的最后一个进程拆离后它就会消失。
C
当第一个附加进程运行时，如果有关的共享内存段被清空。
-
如果没有设置相应的特定标志。
接下来的九个字符作为每三个一组解释。第一组是指拥有者有许可权；第二组是指在设施项的用户组中其他用户的许可权；最后一组指所有的用户。在每组中，第一个字符表示允许读，第二个字符表示可以写或者修改设施项，最后一个字符当前没有用过。

权限如下所示：

r
如果授予了读许可权。
w
如果授予了写许可权。
a
如果授予了修改许可权。
-
如果没有授予指定的许可权。
OWNER （all）设施项所有者的登录名。
GROUP （all）拥有设施项的组名。
CREATOR （a、c）设施项创建者的登录名。
CGROUP （a、c）设施项创建者的组名。

注：对于 OWNER、GROUP、CREATOR 和 CGROUP，显示用户和组的标识而不显示登录名。
CBYTES （a、o）当前停留在相关消息队列中的消息的字节数。
QNUM （a、o）当前停留在相关消息队列中的消息的字节数。
QBYTES （a、b）停留在相关消息队列中消息允许的最大字节数。
LSPID （a、p）发送消息到相关队列的最后进程的标识。如果发送的最后一条消息是来自节点上的进程而不是保留该节点的队列，LSPID 是真正把消息放进队列的内核进程的 PID，而不是发送进程的 PID。
LRPID （a、p）接收来自相关队列的消息的进程标识。如果接收的最后一条消息来自一个节点上的进程而不是保留该队列的节点，LRPID 是真正接收队列上消息的内核进程的 PID ，而不是接收进程的 PID。
STIME （a、t）最后一条消息发送到相关队列的时间。对于远程队列，这是服务器时间。没有做任何措施来补偿本地时钟和服务器时钟之间的时区差异。
RTIME （a、t）接受最后一条来自相关队列的消息的时间。对于远程队列来说，这是服务器时间。没有做任何措施来补偿本地时钟和服务器始终之间的时区差异。
CTIME （a、t）创建和改变相关项的时间。对于远程队列，这是服务器时间。没有做任何措施来本地时钟和服务器时钟之间的任何时区差异。
NATTCH （a、o）连接在关联的共享内存段的进程数。
SEGSZ （a、b）关联的共享内存段的大小。
CPID （a、p）共享内存项的创建程序的进程标识。
LPID （a、p）连接或者拆离共享内存段的最后一个进程的标识。
ATIME （a、t）最后一次与关联的共享内存段完成连接的时间。
DTIME （a、t）最后一次与关联的共享内存段完成拆离的时间。
NSEMS （a、b）在与信号项相关联的信号集中的信号量数量。
OTIME （a、t）在关联的信号量中完成信号量操作的时间。
SID （S）共享内存段的标识。SID 可以用作 svmon -S 命令的输入。

该命令支持多字节字符集。

标志

-a 使用 -b、-c、-o、-p 和 -t 标志。
-b 写入消息队列的队列上消息的最大字节数、共享内存段的大小、每个信号量集中信号量的数量。
-c 写入构建该设施的用户的登录名和组名称。
-CCoreFile 用由 CoreFile 参数指定的文件来代替 /dev/mem 文件。CoreFile 参数是由 Ctrl-(left)Alt-Pad1 按键顺序创建的内存映象文件。
-l 当和 -S 标志一起使用时，该标志写入未展开的 SID 列表。
-m 写入一些关于活动共享内存段的信息。
-NKernel 用指定的 Kernel（/usr/lib/boot/unix 文件是缺省的）。
-o 写以下的使用信息：
队列上的消息数
消息队列上消息的总字节数
连接在共享内存段上的进程数

-p 写进程编号的信息：
最后接收消息队列上消息的进程号
最后在消息队列上发送消息的进程号
创建进程的进程号
最后一个连接或拆离共享内存段的进程编号

-P 写入与共享内存标识有关的 SID（段标识）列表，以及保留在那个段中的字节数，和段是否已启用大页的标志符。如果段支持大页面，就显示一个 'Y'，否则显示一个 '-'。
-q 写入一些关于活动消息队列的信息。
-s 写入一些关于活动信号量集的信息。
-S 写入连接在共享内存标识上的 SID 列表。
-t 写入时间信息：
最后一次更改所有设备访问许可权的控制操作的时间。
消息队列上最后一次执行 msgsnd 和 msgrcv 的时间。
共享内存上最后一次执行 shmat 和 shmdt 的时间。
在信号量集上最后一次执行 semop 的时间。

-T 写入带有日期的 -t 标记的输出。

注:
如果用户指定 -C 或者 -N 标记，实型和有效的 UID／GID 设置为调用 ipcs 的用户的实型 UID／GID。
当运行 ipcs 时可以更改值；仅当检索它时它给出的信息才保证是正确的。