linux高效率编程：epoll和多线程

来源：互联网发布：肖骁绝对是直男知乎编辑：程序博客网时间：2024/06/07 12:24

http://www.cppfans.org/1417.html
http://www.cppfans.org/1418.html
http://www.cppfans.org/1419.html
http://www.cnblogs.com/haippy/archive/2012/01/09/2317269.html
http://liuskysun.blog.163.com/blog/static/998129782012101011430377/
http://www.cnblogs.com/xuxm2007/archive/2011/08/15/2139809.html
http://www.cnblogs.com/iTsihang/archive/2013/05/23/3095775.html
http://blog.csdn.net/hairetz/article/details/4281931/
http://keren.blog.51cto.com/720558/170822/
http://blog.csdn.net/yuanzhangmei1/article/details/8670542
http://blog.chinaunix.net/uid-20718384-id-3418279.html
http://www.cnblogs.com/qlee/archive/2011/09/07/2169831.html
http://hi.baidu.com/xiaoyue1800/item/3697abf77f1c33c5531c26d9
http://blog.csdn.net/wallwind/article/details/6899330
http://blog.sina.com.cn/s/blog_7a2fc53a0100y54h.html

一、epoll简介

epoll是Linux下多路复用IO接口select/poll的增强版本，它能显著提高程序在大量并发连接中只有少量活跃的情况下的系统CPU利用率。

相对于select方法，主要优点有2个：
1. 支持一个进程打开大数目的socket描述符。
2. IO效率不随FD数目增加而线性下降。

IO效率的提升的：
select/poll会因为监听fd的数量而导致效率低下，因为它是轮询所有fd，有数据就处理，没数据就跳过，所以fd的数量增加会降低效率；而epoll只处理就绪的fd，它有一个就绪设备的队列，每次只轮询该队列的数据，然后进行处理（就绪队列的信息正是通过用户自定义的结构来告知的）。
无论是select,poll还是epoll都需要内核把FD消息通知给用户空间，如何避免不必要的内存拷贝就很重要，在这点上，epoll是通过内核与用户空间mmap同一块内存实现的。
而poll与select的主要区别在于，select需要为读、写、异常事件分配创建一个描述符集合，最后轮询的时候，需要分别轮询这三个集合。而poll只需要一个集合，在每个描述符对应的结构上分别设置读、写、异常事件，最后轮询的时候，可以同时检查三种事件。poll与select在处理思想上是同一个层次，当然poll相对于select又优化，而epoll，则是完全不同的机制，有本质上的区别。

EPOLL事件有两种模型 Level Triggered (LT) 和 Edge Triggered (ET)：

LT(level triggered，水平触发模式)是缺省的工作方式，并且同时支持 block 和 non-block socket。在这种做法中，内核告诉你一个文件描述符是否就绪了，然后你可以对这个就绪的fd进行IO操作。如果你不作任何操作，内核还是会继续通知你的，所以，这种模式编程出错误可能性要小一点。

ET(edge-triggered，边缘触发模式)是高速工作方式，只支持no-block socket。在这种模式下，当描述符从未就绪变为就绪时，内核通过epoll告诉你。然后它会假设你知道文件描述符已经就绪，并且不会再为那个文件描述符发送更多的就绪通知，等到下次有新的数据进来的时候才会再次出发就绪事件。如果一直不对这个fd进行I/O操作，导致fd变为未就绪时，内核同样不会发送更多的通知，因为only once。所以这种方式下，出错率比较高，需要增加一些检测程序。

二、epoll的函数

引用头文件：

#include <sys/epoll.h>

1. 创建epoll fd函数

int epoll_create(int size);

epoll_create()创建一个epoll的事例，通知内核需要监听size个fd。size指的并不是最大的后备存储设备，而是衡量内核内部结构大小的一个提示。当创建成功后，会占用一个fd，所以记得在使用完之后调用close()，否则fd可能会被耗尽。

自从Linux2.6.8版本以后，size值其实是没什么用的，不过要大于0，因为内核可以动态的分配大小，所以不需要size这个提示了。

另，int epoll_create1(int flag); 是在linux 2.6.27中加入的函数。
当flag是0时，表示和epoll_create函数完全一样，不需要size的提示了。
当flag = EPOLL_CLOEXEC，创建的epfd会设置FD_CLOEXEC
当flag = EPOLL_NONBLOCK，创建的epfd会设置为非阻塞
一般用法都是使用EPOLL_CLOEXEC.

2. epoll事件的注册函数

int epoll_ctl(int epfd, int op, int fd, struct epoll_event* event);

第一个参数epfd，为epoll_create返回的的epoll fd。

第二个参数op表示操作值。有三个操作类型，

EPOLL_CTL_ADD  // 注册目标fd到epfd中，同时关联内部event到fd上EPOLL_CTL_MOD // 修改已经注册到fd的监听事件EPOLL_CTL_DEL // 从epfd中删除/移除已注册的fd，event可以被忽略，也可以为NULL

第三个参数fd表示需要监听的fd。

第四个参数event表示需要监听的事件，

typedef union epoll_data {void        *ptr;int          fd;uint32_t     u32;uint64_t     u64;} epoll_data_t;struct epoll_event {uint32_t     events;      /* Epoll events */epoll_data_t data;        /* User data variable */};

events参数是一个枚举的集合，可以用” | “来增加事件类型，枚举如下：

EPOLLIN     //表示对应的文件描述符可以读（包括对端SOCKET正常关闭）；EPOLLOUT    //表示对应的文件描述符可以写；EPOLLPRI    //表示对应的文件描述符有紧急的数据可读（这里应该表示有带外数据到来）；EPOLLERR    //表示对应的文件描述符发生错误；epoll_wait会一直等待这个事件，所以一般没必要设置这个属性。EPOLLHUP    //表示对应的文件描述符被挂断；epoll_wait会一直等待这个事件，所以一般没必要设置这个属性。EPOLLET     //将EPOLL设为边缘触发(Edge Triggered)模式，这是相对于水平触发(Level Triggered)来说的。epoll的默认工作方式是LTEPOLLRDHUP  //(since Linux 2.6.17)表示套接字关闭了连接，或者关闭了正写一半的连接。EPOLLONESHOT //(since Linux 2.6.2)只监听一次事件，当监听完这次事件之后，如果还需要继续监听这个socket的话，需要再次把这个socket加入到EPOLL队列里。

用户可以用 epoll_data 这个 union 在 epoll_event 里面附带一些自定义的信息，这个 epoll_data 会随着 epoll_wait 返回的 epoll_event 一并返回。

epoll_data是给用户自由使用的，epoll 不关心里面的内容。一般真正使用起来，事实上第一个就足够了，也就是void *，用来包装任何自定义的结构体（epoll_data是一个联合体，只能使用其中一个，fd等是提供给较简单的应用场景来方便使用的）。

3. epoll等待事件函数

int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);int epoll_pwait(int epfd, struct epoll_event *events, int maxevents, int timeout,  const sigset_t *sigmask);

第一个参数:表示epoll_wait等待epfd上的事件，由epoll_create 生成的epoll专用的文件描述符。

第二个参数:events指针携带有epoll_data_t数据，用于回传代处理事件的数组。

第三个参数:maxevents当前需要监听的所有socket句柄数。

第四个参数:timeout表示超时时间(单位：毫秒)。

epoll_pwait(since linux 2.6.19)允许一个应用程序安全的等待，直到fd设备准备就绪，或者捕获到一个信号量。其中sigmask表示要捕获的信号量。

返回值：函数如果等待成功，则返回fd的数字；0表示等待fd超时，其他错误号请查看errno

三、实例

一个发送压力工具的Demo，主要是演示相关技术的使用。

在linux下使用多线程、epoll编程、socket编程技术实现，系统设置为'ulimit -n' > 10240，可以稳定达到短连接上万的连接，长连接5000个。

设计要点如下：

1. 主函数中循环读取请求数据，新建的3个子线程分别去建立连接，发送请求，接收请求。会初始化2个epoll来分别监听可以写数据（发送请求）的事件和可以读数据（接收请求）的事件。

2. 使用的数据结构为，将socket句柄和相关操作封装在query类中，该query类带有前向和后向指针，该query类会在注册epoll监听队列时通过用户结构体按个指针参数传进去。有3个query类的双链表分别表示空闲队列freeList，准备好发送请求队列readyList，和工作队列workList，这3个队列会被多线程操作，故使用共享锁来排斥性访问。之所以使用双链表结构是便于处理epoll事件时，直接将query切换队列，而无需去遍历。

3. 主线程等待freeList不为空，则取下其中一个结点，读取请求数据，填充到该结点中。并将结点从freeList队列转移到readyList队列。

4. 建立连接子线程会循环等待发送时间到来，以20ms为间隔，每次都新建‘压力值*20/1000’个socket连接，建立成功后则将这些结点加入到send_epoll的队列上。并将结点从readyList队列转移到workList队列。

5. 发送请求子线程会循环等待send_epoll上发生的写事件，并处理就绪的query类，发送请求。请求发送成功后，将该结点从send_epoll的队列中删除，注册到recv_epoll的队列上。

6. 接收请求子线程会循环等待recv_epoll上发生的读事件，并处理就绪的query类，接收请求。接收请求成功后，将结点从recv_epoll的队列上删除，并将结点放回到freeList或readyList。

/*FileName: myPressTool.cpp*/#include <stdlib.h>#include <unistd.h>#include <sys/epoll.h>#include <pthread.h>#include <signal.h>#include "conf.h"#include "query.h"#include "query_list.h"#include "control_send.h"#include "send_req.h"#include "recv_res.h"#include "data.h"//全局变量定义conf_t g_conf;conf_t* g_pconf = NULL; /*配置*/CQuery* g_pfree_list = NULL; /*无数据的CQuery队列*/CQuery* g_pready_list = NULL; /*有数据准备建立连接的CQuery队列*/CQuery* g_pwork_list = NULL; /*发送或接收结果状态的CQuery队列*/int g_send_epoll_fd;int g_recv_epoll_fd;bool g_over = false;size_t g_query_num = 0;int check_res_callback(char* buffer,int len){//  //printf("call call_back funtion %s %d\n",buffer,len);    return 0;}int init_main(){    g_pconf = &g_conf;    if(0 != load_config()){return -1;} /*初始化g_pconf变量*/    /*初始化CQuery队列*/    g_query_num = g_pconf->velocity * g_pconf->BUFFER_NUM;    g_pfree_list = new CQuery[g_query_num];    if( NULL == g_pfree_list ){        return -1;    }    g_pfree_list[0].set_pre_query(NULL);    g_pfree_list[0].set_next_query(&g_pfree_list[1]);    for(size_t i=1;i<g_query_num-1;i++){        g_pfree_list[i].set_pre_query(&g_pfree_list[i-1]);        g_pfree_list[i].set_next_query(&g_pfree_list[i+1]);    }    g_pfree_list[g_query_num-1].set_pre_query(&g_pfree_list[g_query_num-2]);    g_pfree_list[g_query_num-1].set_next_query(NULL);    /* init epoll list */    if(0 > (g_send_epoll_fd = epoll_create(g_query_num))){ /*创建发送epoll，其参数已无意义，只需要一个非负数即可*/            return -2;    }    if(0 > (g_recv_epoll_fd = epoll_create(g_query_num))){ /*创建接收epoll，其参数已无意义，只需要一个非负数即可*/            return -2;    }    /*初始化共享锁*/    init_query_list_lock();    return 0;}int clean_main(){    CQuery* tp = g_pwork_list;    CQuery* tdel = NULL;    while(NULL != tp){        tp->close_socket();        tdel=tp;        tp=tp->get_next_query();        delete tdel;    }    tp = g_pready_list;    while(NULL != tp){        tp->close_socket();        tdel=tp;        tp=tp->get_next_query();        delete tdel;    }    tp = g_pfree_list;    while(NULL != tp){        tp->close_socket();        tdel=tp;        tp=tp->get_next_query();        delete tdel;    }    /*关闭epoll socket*/    close(g_send_epoll_fd);    close(g_recv_epoll_fd);    /*销毁共享锁*/    destroy_query_list_lock();    return 0;}int main(){    pthread_t control_pid;    pthread_t send_pid;    pthread_t recv_pid;    if(0 != init_main()){return -1;} /*初始化全局变量*/    //忽略SIGPIPE信号，该信号默认是使当前程序退出。当目标机器的socket已经关闭连接时，再调用write()发送数据会收到一个RST响应，第二次调用write()发送数据时会先调用SIGPIPE响应函数，然后write返回-1,errno号为EPIPE(32)    signal(SIGPIPE, SIG_IGN);    //新建3个子线程    if(0 != pthread_create(&control_pid, NULL, control_send_main, NULL)){clean_main();return -2;}    if(0 != pthread_create(&send_pid, NULL, send_req_main, NULL)){clean_main();return -2;}    if(0 != pthread_create(&recv_pid, NULL, recv_res_main, (void*)check_res_callback)){clean_main();return -2;}    //循环读取数据，数据全部读完返回1，free队列用完返回0    while(0 == read_data()){        usleep(DEFAULT_SEND_EACH_TIME); /*等待一个发送间隔后再读取数据*/        //printf("======WARNNING: free list is NULL!\n");    }    //等待使用中的队列为空再结束    while( NULL != g_pwork_list ){        usleep(100000);    }    g_over = true; /*通知子线程结束*/    pthread_join(send_pid,NULL);    pthread_join(recv_pid,NULL);    pthread_join(control_pid,NULL);    if(0 != clean_main()){return -3;} /*清理全局变量*/    return 0;}

/*FileName: control_send.h*/#ifndef __CONTROL_SEND_H__#define __CONTROL_SEND_H__#include <sys/time.h>#include <unistd.h>#include <sys/epoll.h>#include "query_list.h"#include "conf.h"//定义每次发送时间，默认为10毫秒#define DEFAULT_SEND_EACH_TIME  10000void* control_send_main(void *);void prepare_to_send();bool wait_send_time();void init_c_data();extern int g_send_epoll_fd;extern conf_t* g_pconf;extern bool g_over;typedef struct _control_send_thread_data{    struct timeval send_time;    struct timeval current_time;    int start_time;    int compute_time;    size_t current_velocity;    //修正压力,    float fix_velocity;}control_send_thread_data;#endif

/*FileName: control_send.cpp*/#include "control_send.h"control_send_thread_data c_data;void init_c_data(){    gettimeofday(&c_data.send_time,NULL);    c_data.start_time = c_data.send_time.tv_sec;    c_data.compute_time = c_data.start_time;    c_data.current_velocity = g_pconf->velocity;    c_data.fix_velocity =0.0;        //计算进位    if(c_data.send_time.tv_usec + DEFAULT_SEND_EACH_TIME > 999999){        c_data.send_time.tv_usec = c_data.send_time.tv_usec + DEFAULT_SEND_EACH_TIME - 1000000;        c_data.send_time.tv_sec++;        }    else {        c_data.send_time.tv_sec = c_data.send_time.tv_sec;        c_data.send_time.tv_usec = c_data.send_time.tv_usec + DEFAULT_SEND_EACH_TIME;    }}//循环等待到达发送时间，本函数保证每隔DEFAULT_SEND_EACH_TIME=10ms可以准许发送一次bool wait_send_time(){    struct timeval tv;    while(true){ /*等待当前时间到达发送时间，在prepare_to_send()函数中计算下次的发送时间*/        gettimeofday(&tv,NULL);        if((tv.tv_usec > c_data.send_time.tv_usec && tv.tv_sec == c_data.send_time.tv_sec)            || (tv.tv_sec - c_data.send_time.tv_sec)*1000000 + tv.tv_usec - c_data.send_time.tv_usec > 0 ){            c_data.current_time.tv_sec =tv.tv_sec; /*准许发送，记录当前时间*/            c_data.current_time.tv_usec = tv.tv_usec;            return true;        }        usleep(DEFAULT_SEND_EACH_TIME/100); /*等待发送间隔的100分之一*/    }    return false;}void* control_send_main(void *){    init_c_data();    while(!g_over){        if(wait_send_time()){            prepare_to_send();        }    }    return NULL;}void prepare_to_send(){    /*计算下次发送的时间*/    int time_pass = (c_data.current_time.tv_sec - c_data.send_time.tv_sec)*1000000                + (c_data.current_time.tv_usec-c_data.send_time.tv_usec);    if(0 > time_pass){        time_pass =0; /*出错情况，修正后继续发送*/    }    if(c_data.current_time.tv_usec + DEFAULT_SEND_EACH_TIME - time_pass > 999999){ /*跨秒情况*/        c_data.send_time.tv_usec = c_data.current_time.tv_usec + DEFAULT_SEND_EACH_TIME - time_pass - 1000000;        c_data.send_time.tv_sec = c_data.current_time.tv_sec+1;    }    else { /*未跨秒情况*/        c_data.send_time.tv_sec = c_data.current_time.tv_sec;        c_data.send_time.tv_usec = c_data.current_time.tv_usec + DEFAULT_SEND_EACH_TIME - time_pass;    }    /*计算本次需要发送的请求数*/        int velocity = c_data.current_velocity * ( DEFAULT_SEND_EACH_TIME)/1000000 ;    c_data.fix_velocity += float(c_data.current_velocity) * DEFAULT_SEND_EACH_TIME /1000000 - velocity; /*使用浮点数计算对压力值的误差进行积累，并在超过1后进行修正*/    if(c_data.fix_velocity > 1.0f){        velocity += 1;        c_data.fix_velocity -= 1.0f;    }    size_t try_num=0;    size_t keep_alive_num=0;    CQuery* work_query;    for(int i=0;i<velocity;try_num++){ /*为每个请求建立TCP连接*/        while( NULL == (work_query = get_ready_query()) ){            usleep(DEFAULT_SEND_EACH_TIME/100);            //printf("============WARNNING: ready list is NULL!\n");        }                /*建立连接*/        if(g_pconf->keepAlive && work_query->is_sock_ok()){ /*长连接，优先使用已有连接*/            //printf("keepAlive use old connection.\n");            struct epoll_event evt;            evt.events = EPOLLERR | EPOLLET | EPOLLHUP | EPOLLOUT;            evt.data.ptr = work_query;            if(0 > epoll_ctl(g_send_epoll_fd,EPOLL_CTL_ADD,work_query->get_socket(),&evt)){                add_free_list(work_query);                continue;            }            keep_alive_num++;        } else { /*短连接*/            if( 0 > work_query->make_tcp_connect(g_pconf->ip, g_pconf->port) ){                //printf("make_tcp_connect failed: %d.\n", work_query->check_socket_err());                work_query->close_socket();                add_free_list(work_query);                continue;            }            /*把建立的socket连接添加到send_epoll的监听队列上*/            struct epoll_event evt;            evt.events = EPOLLERR | EPOLLHUP | EPOLLOUT;            evt.data.ptr = work_query;             if(0 > epoll_ctl(g_send_epoll_fd,EPOLL_CTL_ADD,work_query->get_socket(),&evt)){                //printf("epoll_ctl failed.\n");                work_query->close_socket();                add_free_list(work_query);                continue;            }        }        /*建立连接成功，放入work队列*/        add_work_list(work_query);        i++;    }    printf("Add to work list, send: %d, keep_alive: %d, try-failed: %d.\n", velocity, keep_alive_num, try_num-velocity);}

/*FileName: send_req.h*/#ifndef __SEND_REQ_H__#define __SEND_REQ_H__#include <stddef.h>#include <stdlib.h>#include <sys/epoll.h>#include "query.h"#include "query_list.h"void* send_req_main(void*);extern int g_send_epoll_fd;extern int g_recv_epoll_fd;extern bool g_over;extern size_t g_query_num;#endif

/*FileName: send_req.cpp*/#include "send_req.h"void* send_req_main(void*){    CQuery* pQuery = NULL;    struct epoll_event ep_evt[g_query_num];    while(!g_over){        int ready_num = epoll_wait(g_send_epoll_fd,ep_evt,g_query_num,TIME_OUT); /*等待事件*/        //printf("send event num: %d.\n", ready_num);        size_t fin_num=0, err_num=0;        for(int i=0;i<ready_num;i++){            pQuery = (CQuery*)ep_evt[i].data.ptr;                epoll_ctl(g_send_epoll_fd,EPOLL_CTL_DEL,pQuery->get_socket(),NULL); /*不再在send_epoll上监听该socket*/                if(ep_evt[i].events & EPOLLOUT){ /*为写事件*/                if(!pQuery->is_sock_ok() || 0 > pQuery->send_query()){ /*发送请求数据*/                    pQuery->close_socket();                    del_work_list(pQuery);                    add_free_list(pQuery);                    err_num++;                    continue;                }                    struct epoll_event evt;                evt.events = EPOLLIN | EPOLLET |  EPOLLERR | EPOLLHUP | EPOLLPRI;                evt.data.ptr = pQuery;                if(0 > epoll_ctl(g_recv_epoll_fd,EPOLL_CTL_ADD,pQuery->get_socket(),&evt)){ /*注册在recv_epoll的监听队列上*/                    pQuery->close_socket();                    del_work_list(pQuery);                    add_free_list(pQuery);                    err_num++;                    continue;                }                fin_num++;            } else { /*不是写事件*/                pQuery->close_socket();                del_work_list(pQuery);                add_free_list(pQuery);                err_num++;            }        }        //printf("send done. event: %d, finish: %d, error: %d.\n", ready_num, fin_num, err_num);    }    return NULL;}

/*FileName: recv_res.h*/#ifndef __RECV_RES_h__#define __RECV_RES_h__#include <stddef.h>#include <stdlib.h>#include <sys/epoll.h>#include "conf.h"#include "query.h"#include "query_list.h"#include "data.h"typedef int (*CALL_BACK)(char*, int);void* recv_res_main(void*);extern size_t g_query_num;extern int g_recv_epoll_fd;extern conf_t* g_pconf;extern bool g_over;#endif

/*FileName: recv_res.cpp*/#include "recv_res.h"void* recv_res_main(void* call_back_funtion){    CQuery* pQuery = NULL;    struct epoll_event ep_evt[g_query_num];        while(!g_over){                int ready_num = epoll_wait(g_recv_epoll_fd,ep_evt,g_query_num,TIME_OUT);        //printf("recv event num: %d.\n", ready_num);        size_t fin_num=0, alive_num=0, err_num=0;        for(int i=0;i<ready_num;i++){ /*循环处理每个就绪的事件*/            pQuery =(CQuery*) ep_evt[i].data.ptr;            epoll_ctl(g_recv_epoll_fd,EPOLL_CTL_DEL,pQuery->get_socket(),NULL);            if(ep_evt[i].events & EPOLLIN){ /*读事件*/                if( !pQuery->is_sock_ok() || 0 > pQuery->recv_reply()){ /*接收请求数据*/                    pQuery->close_socket();                    del_work_list(pQuery);                    add_free_list(pQuery);                    err_num++;                    continue;                }                //调用callBack函数校验数据                if(NULL != call_back_funtion){                    (*((CALL_BACK)call_back_funtion))(pQuery->get_query_buffer(),                            pQuery->get_query_len());                }                /*接收数据完毕*/                if( g_pconf->keepAlive){ /*长连接模式，重用socket连接，重新装填数据后放入ready队列*/                    if( 0 != _read_data(pQuery) ){                        pQuery->close_socket();                        del_work_list(pQuery);                        add_free_list(pQuery);                        err_num++;                    }                    del_work_list(pQuery);                    add_ready_list(pQuery);                    alive_num++;                } else { /*非长连接模式，直接关闭socket后放入free队列*/                    pQuery->close_socket();                    del_work_list(pQuery);                    add_free_list(pQuery);                    fin_num++;                }            } else { /*非读事件*/                pQuery->close_socket();                del_work_list(pQuery);                add_free_list(pQuery);                err_num++;            }        }        //printf("recv done. event: %d, finish: %d, alive: %d, error: %d.\n", ready_num, fin_num+alive_num, alive_num, err_num);    }    return NULL;}

/*FileName: conf.h*/#ifndef __CONF_H__#define __CONF_H__#include <string.h>typedef struct _conf_t{    int velocity; /*目标压力*/    char ip[16]; /*目标主机ip*/    int port; /*目标主机端口*/    bool keepAlive; /*是否保存长连接*/    int BUFFER_NUM; /*申请buffer的基数，buffer数=(BUFFER_NUM*velocity) */}conf_t;int load_config();extern conf_t* g_pconf;#endif

/*FileName: conf.cpp*/#include "conf.h"int load_config(){    g_pconf->velocity = 5000;    strncpy(g_pconf->ip, "10.26.97.46", sizeof(g_pconf->ip));    g_pconf->port = 8183;    g_pconf->keepAlive = true;    if(g_pconf->keepAlive)g_pconf->BUFFER_NUM = 2;    else g_pconf->BUFFER_NUM = 10;    return 0;}

/*FileName: data.h*/#ifndef __DATA_H__#define __DATA_H__#include <string.h>#include "query_list.h"int _read_data( CQuery* pQuery );int read_data();#endif

/*FileName: data.cpp*/#include "data.h"int read_data(){    CQuery* pQuery=NULL;    size_t send_num=0;    int read_ret=0;    while( NULL != (pQuery = get_free_query()) ){        if( 0 != (read_ret=_read_data(pQuery)) ){            add_free_list(pQuery);            if( 1 == read_ret ){ /*文件读完了*/                return 1;            } else { /*读取遇到错误，继续尝试*/                continue;            }        }        add_ready_list(pQuery); /*添加到ready队列*/        send_num++;    }/*        int flen=0,rlen=0,wlen=0;    CQuery* tp = g_pfree_list;    while(NULL != tp){        tp = tp->get_next_query();        flen++;    }    tp = g_pready_list;    while(NULL != tp){        tp = tp->get_next_query();        rlen++;    }    tp = g_pwork_list;    while(NULL != tp){        tp = tp->get_next_query();        wlen++;    }*/    //printf("Add to ready list: %d. free: %d, ready: %d, work: %d.\n", send_num, flen, rlen, wlen);    return 0;}int _read_data( CQuery* pQuery ){    char* request = new char[MAX_QUERY_LEN+1];    char* fun_type = "GET";    char* url = "/index.html";    char* accept_type = "html/text";    char* ip = "127.0.0.1";    int port = 80;    char* connection_type = NULL;    if(g_pconf->keepAlive){        connection_type = "Keep-Alive";    }else{        connection_type = "Close";    }        snprintf(request, MAX_QUERY_LEN+1, "%s %s HTTP/1.1\r\nAccept: %s\r\nHost: %s:%d\r\nConnection: %s\r\n\r\n", fun_type, url, accept_type, ip, port, connection_type);    pQuery->set_query(request, strnlen(request, MAX_QUERY_LEN)); /*读入数据到pQuery*/    delete []request;    return 0;}

/*FileName: query.h*/#ifndef __QUERY_H__#define __QUERY_H__#include <stdlib.h>#include <unistd.h>#include <stdio.h>#include <errno.h>#include <sys/epoll.h>#include <sys/socket.h>#include <fcntl.h>#include <sys/types.h>#include <arpa/inet.h>#include <netinet/tcp.h>//#include<linux/tcp.h>#include "conf.h"/*接收数据的缓冲大小*/#define MAX_QUERY_LEN       4096#define TIME_OUT      1000typedef enum _QUERY_STATE_e{    QUERY_STATE_SEND=1,    QUERY_STATE_RECV,    QUERY_STATE_IDLE}QUERY_STATE;class CQuery{    public:        CQuery()            :m_socket_fd(-1)            ,m_query_len(-1)            {                pPre_query=NULL;                pNext_query=NULL;                m_state = QUERY_STATE_IDLE;                m_str_Query[0]='\0';            }        ~CQuery();        /*操作socket*/        int make_tcp_connect(const char* pIP,const int port);        int send_query();        int recv_reply();        int close_socket();        bool is_sock_ok();        int check_socket_err();        /*get & set操作*/        int set_query_sock(int sock);        int get_socket();        int set_query(const char * pBuf,const int buf_len);        char* get_query_buffer();        int get_query_len();        int set_pre_query(CQuery* pQuery);        CQuery* get_pre_query();        int set_next_query(CQuery* pQuery);        CQuery* get_next_query();    private:        int     m_socket_fd;            //socket fd        char    m_str_Query[MAX_QUERY_LEN+1];   //接收的数据        int     m_query_len;            //  query长度        CQuery* pPre_query;            //上一个req        CQuery* pNext_query;            //下一个req        QUERY_STATE m_state;};extern conf_t* g_pconf;#endif

/*FileName: query.cpp*/#include "query.h"inline int SetSockNonblock(int sockfd){        int flag = 0;        if(0 > (flag = fcntl(sockfd, F_GETFL, 0))){ /*fcntl()针对(文件)描述符提供控制；F_GETFL 取得文件描述词状态旗标，此旗标为open（）的参数flags。*/                return -1;        }        if(0 > fcntl(sockfd, F_SETFL, flag | O_NONBLOCK)){ /*F_SETFL 设置文件描述词状态旗标，参数arg为新旗标，但只允许O_APPEND、O_NONBLOCK和O_ASYNC位的改变，其他位的改变将不受影响。此处设置为非阻塞方式*/                return -1;        }        return 0;}CQuery::~CQuery(){    close_socket();};//建立socket并对实参给出的pIP:port建立连接，就绪后保存到m_socket_fd待用int CQuery::make_tcp_connect(const char* pIP,const int port){        if((NULL == pIP) || (0 == port)){                return -99;        }        if( QUERY_STATE_IDLE != m_state ){ /*如果已经建立了socket，就先关闭它再继续；socket都是在调用该函数时才关闭，故必须有这个判断和关闭*/                close_socket();        }        if(0 > (m_socket_fd = socket(AF_INET, SOCK_STREAM, 0))){ /*建立socket，参数表示面向网络的连接，并且是面向连接的基于TCP的应用*/                m_socket_fd = -1;                return -10;        }        int one = 1;        if(setsockopt(m_socket_fd, SOL_SOCKET, SO_REUSEADDR, (char *) &one, sizeof(int)) < 0) /*设置socket参数：允许套接口和一个已在使用中的地址捆绑*/        {                close_socket();                return -2;        }        one = 1;        if(setsockopt(m_socket_fd, IPPROTO_TCP, TCP_NODELAY, (char *) &one, sizeof(int)) < 0) /*设置socket参数：禁止Nagle算法。Nagle算法通过将未确认的数据存入缓冲区直到蓄足一个包一起发送的方法，来减少主机发送的零碎小数据包的数目。*/        {                close_socket();                return -3;        }        struct linger m_linger;        m_linger.l_onoff=1;        m_linger.l_linger=0;        if(setsockopt(m_socket_fd,SOL_SOCKET,SO_LINGER,(const char*)&m_linger,sizeof(m_linger)) <0) /*设置socket参数：如关闭(closesocket()调用已执行)时有未发送数据，则逗留。*/        {                close_socket();                return -4;        }        if(0 > SetSockNonblock(m_socket_fd)){ /*设置fd参数：设置为非阻塞模式*/                close_socket();                return -5;        }        struct sockaddr_in servaddr; /*保存服务器地址，用于connect()函数*/        memset(&servaddr, 0, sizeof(servaddr));        servaddr.sin_family = AF_INET;        servaddr.sin_port = htons(port); /*将一个无符号短整型的主机数值转换为网络字节顺序，即大尾顺序(big-endian)。网络字节顺序是TCP/IP中规定好的一种数据表示格式，它与具体的CPU类型、操作系统等无关，从而可以保证数据在不同主机之间传输时能够被正确解释，网络字节顺序采用big-endian排序方式。*/        if(0 >= inet_pton(AF_INET, pIP, &(servaddr.sin_addr))){ /*Linux下IP地址转换函数，可以在将IP地址在“点分十进制”和“整数”之间转换*/                close_socket();                return -6;        }        int ret_code = connect(m_socket_fd, (struct sockaddr *)&servaddr, sizeof(servaddr)); /*在客户端的套接字上发送连接请求*/        if((0 > ret_code) && (EINPROGRESS != errno)){                close_socket();                return -20;        }        m_state=QUERY_STATE_SEND;         return 0;}int CQuery::send_query(){    if( QUERY_STATE_SEND != m_state ){        close_socket();        return -1;    }    if ( !is_sock_ok() )return -2;    int send_byte=0,have_send=0;    while( have_send < m_query_len ){ /*用一个while循环不断的写入数据，但是循环过程中的buf参数和nbytes参数是我们自己来更新的。返回值大于0，表示写了部分数据或者是全部的数据。返回值小于0，此时出错了，需要根据错误类型进行相应的处理*/        send_byte = write(m_socket_fd, m_str_Query+have_send, m_query_len-have_send); /*将socket当普通文件进行读写就可以*/        if(send_byte <= 0){            if(errno== EINTR || EAGAIN == errno ){ /*EINTR 此调用被信号所中断；EAGAIN 当使用不可阻断I/O 时（O_NONBLOCK），若无数据可读取则返回此值。*/                continue;            }            else{                close_socket();                return -2;            }        }        have_send += send_byte;    }    m_state=QUERY_STATE_RECV; /*发送完毕，设置标记*/    return have_send;}int CQuery::recv_reply(){    if( QUERY_STATE_RECV != m_state ){        close_socket();        return -1;    }    if( !is_sock_ok() )return -2;    int read_byte=0,have_read=0;    while( (read_byte = read(m_socket_fd, m_str_Query+have_read, MAX_QUERY_LEN-have_read)) != 0){        if(read_byte < 0){            if(EINTR == errno){                read_byte = 0;                continue;            }else if(EAGAIN == errno){ /*数据未就绪，应该再尝试读；但是对于长连接，读完数据后会一直是这个状态。*/                if(g_pconf->keepAlive){read_byte=0;break;}                read_byte = 0;                continue;            }else{                close_socket();                return -2;            }        }        have_read += read_byte;        if( have_read >= MAX_QUERY_LEN )        {            break;        }    }    if( have_read >= MAX_QUERY_LEN ) /*数据超过最大Query长度，则舍弃后面的数据*/    {        char bad_buff[MAX_QUERY_LEN];        while( (read_byte = read(m_socket_fd, bad_buff, MAX_QUERY_LEN)) != 0 ){            if(read_byte < 0){                if(EINTR == errno ){                    read_byte = 0;                    continue;                }else{                    close_socket();                    return -2;                }            }        }    }    m_state=QUERY_STATE_SEND; /*接收完毕，设计标记为可发送*/    return have_read;}int CQuery::close_socket(){    if(0 <= m_socket_fd){            while(close(m_socket_fd) && (EINTR == errno));            m_socket_fd = -1;    }    m_state = QUERY_STATE_IDLE;    return 0;}bool CQuery::is_sock_ok(){    return (m_socket_fd > 0);}int CQuery::check_socket_err(){       int error;    int len = sizeof(error);            if(getsockopt(m_socket_fd,SOL_SOCKET,SO_ERROR,&error,(socklen_t*)&len) < 0){        return -1;    }    else            return  error;}int CQuery::set_query_sock(int sock){    if(0 < m_socket_fd && 0 < sock){        close_socket();    }    m_socket_fd = sock;}int CQuery::get_socket(){    return m_socket_fd; }int CQuery::set_query(const char* pBuf,const int buf_len){    memcpy(m_str_Query,pBuf,buf_len);    m_query_len = buf_len;    m_str_Query[buf_len] ='\0';    return 0;}char* CQuery::get_query_buffer(){    return m_str_Query;}int CQuery::get_query_len(){    return m_query_len;}int CQuery::set_pre_query(CQuery* pQuery){    pPre_query = pQuery;    return 0;}CQuery* CQuery::get_pre_query(){    return pPre_query;}int CQuery::set_next_query(CQuery* pQuery){    pNext_query = pQuery;    return 0;}CQuery* CQuery::get_next_query(){    return pNext_query;}

/*FileName: query_list.h*/#ifndef __QUERY_LIST_H__#define __QUERY_LIST_H__#include <pthread.h>#include <stdio.h>#include "query.h"int init_query_list_lock();int destroy_query_list_lock();CQuery* get_free_query();int add_free_list(CQuery* pQuery);CQuery* get_ready_query();int add_ready_list(CQuery* pQuery);int add_work_list(CQuery* pQuery);int del_work_list(CQuery* pQuery);extern CQuery* g_pfree_list;extern CQuery* g_pready_list;extern CQuery* g_pwork_list;#endif

/*FileName: query_list.cpp*/#include "query_list.h"pthread_mutex_t free_list_mutex;pthread_mutex_t ready_list_mutex;pthread_mutex_t work_list_mutex;int init_query_list_lock(){    pthread_mutex_init(&free_list_mutex,NULL);    pthread_mutex_init(&ready_list_mutex,NULL);    pthread_mutex_init(&work_list_mutex,NULL);    return 0;}int destroy_query_list_lock(){    pthread_mutex_destroy(&free_list_mutex);    pthread_mutex_destroy(&ready_list_mutex);    pthread_mutex_destroy(&work_list_mutex);    return 0;}CQuery* get_free_query(){    CQuery* pQuery = NULL;    pthread_mutex_lock(&free_list_mutex);    if(NULL == g_pfree_list){        pthread_mutex_unlock(&free_list_mutex);        return NULL;    }    pQuery = g_pfree_list;    g_pfree_list = g_pfree_list->get_next_query();    if( NULL != g_pfree_list )g_pfree_list->set_pre_query(NULL);    pthread_mutex_unlock(&free_list_mutex);    pQuery->set_pre_query(NULL);    pQuery->set_next_query(NULL);    return pQuery;}int add_free_list(CQuery* pQuery){    pthread_mutex_lock(&free_list_mutex);    if(NULL == g_pfree_list){        pQuery->set_pre_query(NULL);        pQuery->set_next_query(NULL);        g_pfree_list = pQuery;    } else {        pQuery->set_pre_query(NULL);        pQuery->set_next_query(g_pfree_list);        pQuery->get_next_query()->set_pre_query(pQuery);        g_pfree_list = pQuery;    }    pthread_mutex_unlock(&free_list_mutex);    return 0;}CQuery* get_ready_query(){    CQuery* pQuery = NULL;    pthread_mutex_lock(&ready_list_mutex);    if(NULL == g_pready_list){        pthread_mutex_unlock(&ready_list_mutex);        return NULL;    }    pQuery = g_pready_list;    g_pready_list = g_pready_list->get_next_query();    if( NULL != g_pready_list )g_pready_list->set_pre_query(NULL);    pthread_mutex_unlock(&ready_list_mutex);    pQuery->set_pre_query(NULL);    pQuery->set_next_query(NULL);    return pQuery;}int add_ready_list(CQuery* pQuery){    pthread_mutex_lock(&ready_list_mutex);    if(NULL == g_pready_list){        pQuery->set_pre_query(NULL);        pQuery->set_next_query(NULL);        g_pready_list = pQuery;    } else {        pQuery->set_pre_query(NULL);        pQuery->set_next_query(g_pready_list);        pQuery->get_next_query()->set_pre_query(pQuery);        g_pready_list = pQuery;    }    pthread_mutex_unlock(&ready_list_mutex);    return 0;}int add_work_list(CQuery* pQuery){    pthread_mutex_lock(&work_list_mutex);    if(NULL == g_pwork_list){        pQuery->set_pre_query(NULL);        pQuery->set_next_query(NULL);        g_pwork_list = pQuery;    } else {        pQuery->set_pre_query(NULL);        pQuery->set_next_query(g_pwork_list);        pQuery->get_next_query()->set_pre_query(pQuery);        g_pwork_list = pQuery;    }    pthread_mutex_unlock(&work_list_mutex);    return 0;}int del_work_list(CQuery* pQuery){    pthread_mutex_lock(&work_list_mutex);    if( NULL != pQuery->get_pre_query() ){        pQuery->get_pre_query()->set_next_query(pQuery->get_next_query());    } else {        g_pwork_list = pQuery->get_next_query();    }    if( NULL != pQuery->get_next_query() ){        pQuery->get_next_query()->set_pre_query(pQuery->get_pre_query());    }    pthread_mutex_unlock(&work_list_mutex);    pQuery->set_pre_query(NULL);    pQuery->set_next_query(NULL);    return 0;}

#FileName: Makefile#Compile cmd: makeCC  = gccCPP = g++CXX = gccEXECUTABLE = myPressToolall     :  $(EXECUTABLE)rm -f *.oclean   :rm -f *.o $(EXECUTABLE)$(EXECUTABLE): myPressTool.o conf.o control_send.o data.o query.o query_list.o recv_res.o send_req.o$(CPP) -o $@ $^ -lm -lpthread%.o     : %.cpp$(CPP)  -c $< -o $@

附录A. 文件描述符fd

内核（kernel）利用文件描述符（file descriptor）来访问文件。文件描述符是非负整数。打开现存文件或新建文件时，内核会返回一个文件描述符。读写文件也需要使用文件描述符来指定待读写的文件。

文件描述符在形式上是一个非负整数。实际上，它是一个索引值，指向内核为每一个进程所维护的该进程打开文件的记录表。当程序打开一个现有文件或者创建一个新文件时，内核向进程返回一个文件描述符。

文件描述符的范围是0 ~ OPEN_MAX ，可以在如下位置查看：/usr/include/linux/limits.h:#define OPEN_MAX 256

有三个特殊的文件描述符，每个进程在创建时，都默认打开三个文件描述符：标准输入（standard input）的文件描述符是 0，标准输出（standard output）是 1，标准错误（standard error）是 2。POSIX 定义了 STDIN_FILENO、STDOUT_FILENO 和 STDERR_FILENO 来代替 0、1、2。这三个符号常量的定义位于头文件 unistd.h。

//FileName: file_descriptor.cpp//Compile: g++ -o file_descriptor.out file_descriptor.cpp //Run: ./file_descriptor.out#include <stdio.h>#include <fcntl.h>int main(void){        int fd;        fd = open("/tmp/tmp.txt", O_RDONLY | O_CREAT, S_IRWXU | S_IRGRP | S_IROTH); /*只读打开，若不存在则创建，创建的文件属性为拥有者读写执行，组只读，其他只读*/        //打开或创建的文件会获取一个fd，且排在STDIN_FILENO、STDOUT_FILENO 和 STDERR_FILENO之后，应该为3        printf("fd:%d\n", fd);        return 0;}

内核使用三种数据结构表示打开的文件：
（1）文件描述符表：
用户区的一部分，除非通过使用文件描述符的函数，否则程序无法对其进行访问。对进程中每个打开的文件，该表都包含一个文件描述符条目，fd值即该文件在该表中的下标索引。与每个文件描述符相关联的是：
a）文件描述符标志（close_on_exec）.
b)）指向系统文件表的某个条目的指针。
（2）系统文件表：
为系统中所有的进程共享。对每个活动的open, 它都包含一个条目。每个系统文件表的条目都包含文件偏移量、以及。每个文件表项包含：
a）访问模式（读、写、or 读-写）
b）（在内存索引节点表中）当前文件的偏移量
c）指向它的文件描述符表的条目计数
（3）内存索引节点表：
对系统中的每个活动的文件（被某个进程打开了），内存中索引节点表都包含一个条目。几个系统文件表条目可能对应于同一个内存索引节点表的条目（不同进程打开同一个文件）。

若2个进程同时打开一个文件做读操作，每个进程都有自己相对于文件的偏移量，而且读入整个文件是独立于另一个进程的；如果2个进程打开同一个文件做写操作，写操作是相互独立的，每个进程都可以重写另一个进程写入的内容。
如果一个进程在open()以后又执行了close()函数，操作系统会删除文件描述符表的对应条目（回收fd），和系统文件表的对应条目（若指向它的描述符表唯一，若不唯一则对该条目的计数减一，不删除该条目，也不对内存索引节点表条目中的计数进行更改），并对内存索引节点表条目中的计数减1，如果自减以后变为0，说明没有其他进程链接此文件，将索引节点表条目也删除。

通过fork()创建子进程时，子进程继承父进程的文件描述符表，即子进程完全复制父进程的文件描述符表。
对于父进程在fork()之前打开的文件来说，子进程都会继承，与父进程共享相同的文件偏移量并相互影响（例如STDIN_FILENO、STDOUT_FILENO 和 STDERR_FILENO ），即对应文件描述符表的条目均指向相同的系统文件表条目。
在fork()之后父进程（或子进程）打开的文件，不与子进程（或父进程）共享文件偏移量并相互独立无影响。即对应文件描述符表的条目指向新增的系统文件表条目，并不相同。

附录B. 多进程

多进程的实例程序如下：

//FileName: multi_pid_example.cpp //Compile: g++ -o multi_pid_example.out multi_pid_example.cpp //Run: ./multi_pid_example.out#include <unistd.h>#include <sys/types.h> #include <stdio.h>#include <stdlib.h>#include <sys/wait.h>//linux进程使用的内存空间分为代码段、堆栈段和数据段：//代码段用来存放程序执行代码，也有可能包含一些只读的常数变量，例如字符串常量等；只读可执行。//堆栈段：Stack，存放局部变量和临时变量如复杂表达式的中间变量；向下增长。//数据段：其空间自下而上又分为：初始化数据区域：已赋值的全局变量和静态变量；BSS：未初始化全局变量和静态变量并在运行前由系统进行清零操作；堆；Heap，例如malloc动态申请的内存；堆向上增长，栈向下增长，两者相对，之间有空洞区域。//可执行代码（linux下为ELF格式）中存储了.text，.data，.bss三个段，其中.bss段只在Section header table中描述端的起始偏移位置和长度，并不分配实际的段数据，也不占用空间。 void print_exit(){       printf("the exit pid:%d\n",getpid() ); /*打印进程pid*/}int main () {     pid_t pid;     atexit( print_exit ); /*注册该进程退出时的回调函数*/    //fork后，子进程会复制父进程的task_struct结构，并为子进程的堆栈分配物理页。子进程和父进程使用相同的代码段；子进程复制父进程的堆栈段和数据段。    //写时复制：一般CPU都是以"页"为单位来分配内存空间的，每一个页都是实际物理内存的一个映像，象INTEL的CPU，其一页在通常情况下是4086字节大小，而无论是数据段还是堆栈段都是由许多"页"构成的，fork函数复制这两个段，只是"逻辑"上的，并非"物理"上的，也就是说，实际执行fork时，物理空间上两个进程的数据段和堆栈段都还是共享着的，当有一个进程写了某个数据时，这时两个进程之间的数据才有了区别，系统就将有区别的"页"从物理上也分开。    //子进程一旦开始运行，子进程和父进程之间就已经不再共享任何数据了。它们再要交互信息时，只有通过进程间通信来实现。    pid=fork(); /*产生子进程*/     //fork产生子进程的表现就是它会返回2次    //一次返回0，顺序执行下面的代码。这是子进程。    //一次返回子进程的pid，也顺序执行下面的代码，这是父进程。    int i;    if (pid < 0)         printf("error in fork!");    else if (pid == 0)         /* 子进程程序 */         for ( i = 1; i <10; i ++ )         {            printf("This is child process\n");            sleep(1);        }    else     {        /* 父进程程序，此时pid值为子进程pid*/         for ( i = 1; i <5; i ++ )         {            printf("This is process process\n");             sleep(1);        }        pid_t pr = wait(NULL); /*阻塞自己，等待一个（注意是一个，不是全部）已经变成僵尸的子进程，wait就会收集这个子进程的信息，并把它彻底销毁后返回；输入可以为&int类型来获取子进程的返回值；返回为子进程的pid*/        printf("I catched a child process with pid of %d\n", pr);    }    return 0;}

exec函数的使用实例：

//FileName: exec_example.cpp//Compile: g++ -o exec_example.out exec_example.cpp//Run: ./exec_example.out#include <stdio.h>#include <stdlib.h>#include <sys/wait.h>#include <unistd.h>#include <sys/types.h>#include <string.h>#include <errno.h>char command[256]; int main() {     int rtn; /*子进程的返回数值*/     while(1) {         /* 从终端读取要执行的命令 */         printf( ">" );         fgets( command, 256, stdin );         command[strlen(command)-1] = 0;         if ( fork() == 0 ) {             /* 子进程执行此命令 */             //在Linux中，exec函数族不止一个，它们分别是：execl，execlp，execle，execv，execve和execvp            //一个进程一旦调用exec类函数，它本身就"死亡"了，系统把代码段替换成新的程序的代码，废弃原有的数据段和堆栈段，并为新程序分配新的数据段与堆栈段，唯一留下的，就是进程号            execlp( command, command );             /* 如果exec函数返回，表明没有正常执行命令，打印错误信息*/             perror( command );             exit( errno );         }         else {             /* 父进程， 等待子进程结束，并打印子进程的返回值 */             wait ( &rtn ); /*阻塞自己，等待有个子进程成为僵尸进程，清理后返回并将子进程的返回值放到rtn变量中*/            printf( " child process return %d\n", rtn );         }     } }

进程之间通信的主要方式有：

1. 管道

#include <unistd.h> int pipe(int filedis[2]); /*建立无名管道。参数filedis返回两个文件描述符：filedes[0]为管道里的读取端，filedes[1]为管道里的写入端。*///当管道中的数据被读取后，管道为空。一个随后的read()调用将默认的被阻塞，等待某些数据写入。

#include<sys/types.h>#include<sys/stat.h>int mkfifo(const char * pathname,mode_t mode); /*建立实名管道。会依参数pathname建立特殊的FIFO文件，该FIFO文件其他进程都可以用读写一般文件的方式存取*/

2. 消息队列

消息队列是一种正逐渐被淘汰的通信方式，我们可以用流管道或者套接口的方式来取代它

3. 共享内存

#include <sys/types.h>#include <sys/ipc.h>#include <sys/shm.h>int shmget(key_t key, size_t size, int shmflg); /*创建一个共享内存对象。成功会返回共享内存的标识符。key为0(IPC_PRIVATE)会建立新共享内存对象；否则使用来源于ftok返回的IPC键值*/void *shmat(int shmid, const void *shmaddr, int shmflg); /*连接共享内存标识符为shmid的共享内存，连接成功后把共享内存区对象映射到调用进程的地址空间，随后可像本地空间一样访问。成功会返回附加好的共享内存地址*/int shmdt(const void *shmaddr); /*断开与共享内存附加点的地址，shmaddr为连接的共享内存的起始地址*/int shmctl(int shmid, int cmd, struct shmid_ds *buf); /*完成对共享内存的控制*/key_t ftok( const char * fname, int id ); /*系统建立IPC通讯 （消息队列、信号量和共享内存） 时必须指定一个ID值。通常情况下，该id值通过ftok函数得到。fname就是你指定的文件名，如果要确保key_t值不变，要么确保ftok的文件不被删除，要么不用ftok，指定一个固定的key_t值*/

4. 信号量

信号量是用来协调不同进程间的数据对象的，信号量是一个计数器，它用来记录对某个资源（如共享内存）的存取状况。

一般说来，为了获得共享资源，进程需要执行下列操作：
　　（1）测试控制该资源的信号量。
　　（2）若此信号量的值为正，则允许进行使用该资源。进程将进号量减1。
　　（3）若此信号量为0，则该资源目前不可用，进程进入睡眠状态，直至信号量值大于0，进程被唤醒，转入步骤（1）。
　　（4）当进程不再使用一个信号量控制的资源时，信号量值加1。如果此时有进程正在睡眠等待此信号量，则唤醒此进程。
维护信号量状态的是Linux内核操作系统而不是用户进程。

#include <sys/types.h>#include <sys/ipc.h>#include <sys/sem.h>int semget(key_t key, int nsems, int semflg); /*创建信号量集标识，或者获取与某个键关联的信号量集标识*/int semop（int semid，struct sembuf *sops，size_t nsops); /*改变一个或一组信号量的值。该函数是PV操作*/int semtimedop(int semid, struct sembuf *sops, unsigned nsops, struct timespec *timeout); /*当semtimedop()调用致使进程进入睡眠时，睡眠时间不能超过timeout参数指定的值*/int semctl(int semid,int semnum,int cmd, union semun arg); /*用来对信号量进行控制操作，不同的操作是通过cmd参数来实现的*/

5. 套接字

套接字（socket）编程是实现Linux系统和其他大多数操作系统中进程间通信的主要方式之一。除了在异地的计算机进程间以外，套接口同样适用于本地同一台计算机内部的进程间通信。
当两个进程在本机上进行Socket通讯时，由于可以使用localhost环回地址，数据不用经过物理网卡，操作系统内核还可以进行某些优化。

面向无连接的套接字通信流程：
服务器：socket(), bind(), recvfrom(), sendto();
客户端：socket(), bind(), sendto(), recvfrom();
面向连接的套接字通信流程：
服务器：socket(), bind(), listen(), accept(), read(), write();
客户端：socket(), connect(), write(), read();

#include <sys/types.h>#include <sys/socket.h>//套接字这套函数同样的功能对应系统函数和库函数2套函数：//库函数是语言本身的一部分，而系统函数是内核提供给应用程序的接口，属于系统的一部分。int socket(int domain, int type, int protocol); /*创建套接字。实际上"建立一个Socket"意味着为一个Socket数据结构分配存储空间。domain：指明所使用的协议族，通常为PF_INET，表示互联网协议族（TCP/IP协议族）；type：指定socket的类型： SOCK_STREAM（流式，面向连接例如TCP服务应用） 或SOCK_DGRAM（数据报式，无连接例如UDP服务应用），Socket接口还定义了原始Socket（SOCK_RAW），允许程序使用低层协议；protocol：通常赋值"0"。 Socket()调用返回一个整型socket描述符，你可以在后面的调用使用它。*/int setsockopt(int sockfd, int level, int optname, const void *optval, socklen_t optlen); /*设置某个套接字选项的值。sockfd：标识一个套接口的描述字。level：选项定义的层次；支持SOL_SOCKET、IPPROTO_TCP、IPPROTO_IP和IPPROTO_IPV6。optname：需设置的选项。optval：指针，指向存放选项值的缓冲区。optlen：optval缓冲区长度。若无错误发生，setsockopt()返回0*/int getsockopt(int sockfd, int level, int optname, void *optval, socklen_t *optlen); /*获取某个套接字选项的值*/ssize_t send(int sockfd, const void *buf, size_t len, int flags); /*发送消息到另一个套接字。返回值为实际发送的字符个数*/ssize_t sendto(int sockfd, const void *buf, size_t len, int flags, const struct sockaddr *dest_addr, socklen_t addrlen); /*发送消息到另一个套接字。返回值为实际发送的字符个数*/ssize_t recv(int sockfd, void *buf, size_t len, int flags); /*从一个套接字接收消息。返回值为实际接收的字符个数*/ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags, struct sockaddr *src_addr, socklen_t *addrlen); /*从一个套接字接收消息。返回值为实际接收的字符个数*/int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen); /*将套接字与IP地址/端口号绑定*/int listen(int sockfd, int backlog); /*设置套接字接口的监听状态*/int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen); /*接受客户端的连接请求，返回值为用于数据传输的文件描述符*/        char* sIp = "127.0.0.1";        int iPort = 80;        struct sockaddr_in servaddr; /*保存服务器地址，用于connect()函数*/        memset(&servaddr, 0, sizeof(servaddr));        servaddr.sin_family = AF_INET;        servaddr.sin_port = htons(iPort); /*将一个无符号短整型的主机数值转换为网络字节顺序，即大尾顺序(big-endian)。网络字节顺序是TCP/IP中规定好的一种数据表示格式，它与具体的CPU类型、操作系统等无关，从而可以保证数据在不同主机之间传输时能够被正确解释，网络字节顺序采用big-endian排序方式。*/        inet_pton(AF_INET, sIp, &(servaddr.sin_addr)) /*Linux下IP地址转换函数，可以在将IP地址在“点分十进制”和“整数”之间转换*/int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen); /*在客户端的套接字上发送连接请求*/

Linux的进程和Win32的进程/线程比较

WIN32里同一个进程里各个线程之间是共享数据段的。这是与Linux的进程最大的不同。
在WIN32下，使用CreateThread函数创建线程，与Linux下创建进程不同，WIN32线程不是从创建处开始运行的，而是由CreateThread指定一个函数，线程就从那个函数处开始运行。
全局变量是子线程与父线程共享的，这就是与Linux进程最大的不同之处。
在Linux要实现类似WIN32的线程并不难，只要fork以后，让子进程调用ThreadProc函数，并且为全局变量开设共享数据区就行了，但在WIN32下就无法实现类似fork的功能了。所以现在WIN32下的C语言编译器所提供的库函数虽然已经能兼容大多数Linux/UNIX的库函数，但却仍无法实现fork。

附录C. 多线程

多线程和共享锁的实例程序如下：

//FileName: multi_thread_example.cpp//Compile: g++ -lpthread -o multi_thread_example.out multi_thread_example.cpp //Run: ./multi_thread_example.out#include <unistd.h>#include <stdio.h>#include <stdlib.h>#include <pthread.h>void *function(void *arg);//定义共享锁pthread_mutex_t mutex;int main(int argc, char *argv[]){    int rc1,rc2;    char *str1="aaaaaaaaaaaaaaaaa";    char *str2="bbbbbbbbbbbbbbbbb";    pthread_t thread1,thread2;    //初始化共享锁     pthread_mutex_init(&mutex,NULL);    //创建线程1，创建后立刻运行    if(rc1 = pthread_create(&thread1,NULL,function,str1))    {        fprintf(stdout,"thread 1 create failed: %d\n",rc1);    }    //创建线程2，创建后立刻运行     if(rc2=pthread_create(&thread2,NULL,function,str2))    {        fprintf(stdout,"thread 2 create failed: %d\n",rc2);    }    //等待线程1和线程2运行结束；如果不加pthread_join函数，主线程会直接运行结束，从而导致子线程未运行完就也被结束。    pthread_join(thread1,NULL);    pthread_join(thread2,NULL);    return 0;}//线程函数 void *function(void *arg){    char *m;    m = (char *)arg;    //使用共享锁隔离关键区域；以下区域打印字符，如果不隔离的话，2个线程会交替打印出类似ababab...的字符串    pthread_mutex_lock(&mutex);    while(*m != '\0')    {        printf("%c",*m);        fflush(stdout);        m++;        sleep(1); /*模拟长时间处理情况*/    }    printf("\n");    //释放共享锁，以让其他线程可以继续执行该段代码    pthread_mutex_unlock(&mutex);}

多线程编程的注意点：

1. 线程安全：

概念比较直观。一般说来，一个函数被称为线程安全的，当且仅当被多个并发线程反复调用时，它会一直产生正确的结果。

要确保函数线程安全，主要需要考虑的是线程之间的共享变量：
属于同一进程的不同线程会共享进程内存空间中的全局区和堆，而私有的线程空间则主要包括栈和寄存器。
因此，对于同一进程的不同线程来说，每个线程的局部变量都是私有的，而全局变量、局部静态变量、分配于堆的变量都是共享的。在对这些共享变量进行访问时，如果要保证线程安全，则必须通过加锁的方式。

2. 可重入：

概念基本没有比较正式的完整解释，但是它比线程安全要求更严格。
根据经验，所谓“重入”，常见的情况是，程序执行到某个函数foo()时，收到信号，于是暂停目前正在执行的函数，转到信号处理函数，而这个信号处理函数的执行过程中，又恰恰也会进入到刚刚执行的函数foo()，这样便发生了所谓的重入。此时如果foo()能够正确的运行，而且处理完成后，之前暂停的foo()也能够正确运行，则说明它是可重入的。

要确保函数可重入，需满足一下几个条件：
1、不在函数内部使用静态或全局数据
2、不返回静态或全局数据，所有数据都由函数的调用者提供。
3、使用本地数据，或者通过制作全局数据的本地拷贝来保护全局数据。
4、不调用不可重入函数。

多进程和多线程编程的比较：

用多进程时每个进程都有自己的地址空间，线程则共享地址空间。
线程机制支持并发程序设计技术，在多处理器上能真正保证并行处理。
切换线程context的时候，windows比linux快一倍多。
Linux下不管是多线程编程还是多进程编程，最终都是用do_fork实现的多进程编程，只是进程创建时的参数不同，从而导致有不同的共享环境。linux把所有的线程都当作进程实现，Linux线程在核内是以轻量级进程的形式存在。
实际应用中基本上都是“进程+线程”的结合方式

1 0