Redis源码剖析和注释(十九)--- Redis 事件处理实现

Redis 事件处理实现

1. Redis事件介绍



事件驱动是一种概括和抽象,也可以称为I/O多路复用(I/O multiplexing),它的实现方式各个系统都不同,一会会说到Redis的方式。


  • 文件事件(file event)Redis服务器通过套接字于客户端(或其他Redis服务器)进行连接,而文件事件就是服务器对套接字操作的抽象。
  • 时间事件(time event):Redis服务器的一些操作需要在给定的事件点执行,而时间事件就是服务器对这类定时操作的抽象。

2. 事件的抽象

Redis将这两个事件分别抽象成一个数据结构来管理。

2.1 文件事件结构

/* File event structure */typedef struct aeFileEvent {    // 文件时间类型:AE_NONE,AE_READABLE,AE_WRITABLE    int mask; /* one of AE_(READABLE|WRITABLE) */    // 可读处理函数    aeFileProc *rfileProc;    // 可写处理函数    aeFileProc *wfileProc;    // 客户端传入的数据    void *clientData;} aeFileEvent;  //文件事件


typedef void aeFileProc(struct aeEventLoop *eventLoop, int fd, void *clientData, int mask);



/* A fired event */typedef struct aeFiredEvent {    // 就绪事件的文件描述符    int fd;    // 就绪事件类型:AE_NONE,AE_READABLE,AE_WRITABLE    int mask;} aeFiredEvent; //就绪事件

2.2 时间事件结构

/* Time event structure */typedef struct aeTimeEvent {    // 时间事件的id    long long id; /* time event identifier. */    // 时间事件到达的时间的秒数    long when_sec; /* seconds */    // 时间事件到达的时间的毫秒数    long when_ms; /* milliseconds */    // 时间事件处理函数    aeTimeProc *timeProc;    // 时间事件终结函数    aeEventFinalizerProc *finalizerProc;    // 客户端传入的数据    void *clientData;    // 指向下一个时间事件    struct aeTimeEvent *next;} aeTimeEvent;  //时间事件



typedef int aeTimeProc(struct aeEventLoop *eventLoop, long long id, void *clientData);typedef void aeEventFinalizerProc(struct aeEventLoop *eventLoop, void *clientData);


2.3 事件状态结构

/* State of an event based program */typedef struct aeEventLoop {    // 当前已注册的最大的文件描述符    int maxfd;   /* highest file descriptor currently registered */    // 文件描述符监听集合的大小    int setsize; /* max number of file descriptors tracked */    // 下一个时间事件的ID    long long timeEventNextId;    // 最后一次执行事件的时间    time_t lastTime;     /* Used to detect system clock skew */    // 注册的文件事件表    aeFileEvent *events; /* Registered events */    // 已就绪的文件事件表    aeFiredEvent *fired; /* Fired events */    // 时间事件的头节点指针    aeTimeEvent *timeEventHead;    // 事件处理开关    int stop;    // 多路复用库的事件状态数据    void *apidata; /* This is used for polling API specific data */    // 执行处理事件之前的函数    aeBeforeSleepProc *beforesleep;} aeEventLoop;  //事件轮询的状态结构

aeEventLoop结构保存了一个void *类型的万能指针apidata,是用来保存轮询事件的状态的,也就是保存底层调用的多路复用库的事件状态,关于Redis的多路复用库的选择,Redis包装了常见的select epoll evport kqueue,他们在编译阶段,根据不同的系统选择性能最高的一个多路复用库作为Redis的多路复用程序的实现,而且所有库实现的接口名称都是相同的,因此Redis多路复用程序底层实现是可以互换的。具体选择库的源码为

// IO复用的选择,性能依次下降,Linux支持 "ae_epoll.c" 和 "ae_select.c"#ifdef HAVE_EVPORT#include "ae_evport.c"#else    #ifdef HAVE_EPOLL    #include "ae_epoll.c"    #else        #ifdef HAVE_KQUEUE        #include "ae_kqueue.c"        #else        #include "ae_select.c"        #endif    #endif#endif

也可以通过Redis客户端的命令来查看当前选择的多路复用库,INFO server> INFO server# Server……multiplexing_api:epoll……


typedef struct aeApiState {    // epoll事件的文件描述符    int epfd;    // 事件表    struct epoll_event *events;} aeApiState;   //事件的状态


epoll模型的struct epoll_event的结构中定义这自己的事件类型,例如EPOLLIN POLLOUT等等,但是Redis的文件事件结构aeFileEvent中也在mask中定义了自己的事件类型,例如:AE_READABLE AE_WRITABLE等,于是,就需要实现一个中间层将两者的事件类型相联系起来,这也就是之前提到的ae_epoll.c文件中实现的相同的API,我们列出来:

// 创建一个epoll实例,保存到eventLoop中static int aeApiCreate(aeEventLoop *eventLoop)// 调整事件表的大小static int aeApiResize(aeEventLoop *eventLoop, int setsize)  // 释放epoll实例和事件表空间static void aeApiFree(aeEventLoop *eventLoop)// 在epfd标识的事件表上注册fd的事件static int aeApiAddEvent(aeEventLoop *eventLoop, int fd, int mask)// 在epfd标识的事件表上注删除fd的事件static void aeApiDelEvent(aeEventLoop *eventLoop, int fd, int delmask)// 等待所监听文件描述符上有事件发生static int aeApiPoll(aeEventLoop *eventLoop, struct timeval *tvp)// 返回正在使用的IO多路复用库的名字static char *aeApiName(void)




  • 向Redis事件状态结构aeEventLoop的事件表event注册一个事件,对应的是epoll_ctl函数
// 在epfd标识的事件表上注册fd的事件static int aeApiAddEvent(aeEventLoop *eventLoop, int fd, int mask) {    aeApiState *state = eventLoop->apidata;    struct epoll_event ee = {0}; /* avoid valgrind warning */    /* If the fd was already monitored for some event, we need a MOD     * operation. Otherwise we need an ADD operation. */    // EPOLL_CTL_ADD,向epfd注册fd的上的event    // EPOLL_CTL_MOD,修改fd已注册的event    // #define AE_NONE 0           //未设置    // #define AE_READABLE 1       //事件可读    // #define AE_WRITABLE 2       //事件可写    // 判断fd事件的操作,如果没有设置事件,则进行关联mask类型事件,否则进行修改    int op = eventLoop->events[fd].mask == AE_NONE ?            EPOLL_CTL_ADD : EPOLL_CTL_MOD;    // struct epoll_event {    //      uint32_t     events;      /* Epoll events */    //      epoll_data_t data;        /* User data variable */    // }; = 0;    // 如果是修改事件,合并之前的事件类型    mask |= eventLoop->events[fd].mask; /* Merge old events */    // 根据mask映射epoll的事件类型    if (mask & AE_READABLE) |= EPOLLIN;   //读事件    if (mask & AE_WRITABLE) |= EPOLLOUT;  //写事件 = fd;    //设置事件所从属的目标文件描述符    // 将ee事件注册到epoll中    if (epoll_ctl(state->epfd,op,fd,&ee) == -1) return -1;    return 0;}
  • 等待所监听文件描述符上有事件发生,对应着底层epoll_wait函数
// 等待所监听文件描述符上有事件发生static int aeApiPoll(aeEventLoop *eventLoop, struct timeval *tvp) {    aeApiState *state = eventLoop->apidata;    int retval, numevents = 0;    // 监听事件表上是否有事件发生    retval = epoll_wait(state->epfd,state->events,eventLoop->setsize,            tvp ? (tvp->tv_sec*1000 + tvp->tv_usec/1000) : -1);    // 至少有一个就绪的事件    if (retval > 0) {        int j;        numevents = retval;        // 遍历就绪的事件表,将其加入到eventLoop的就绪事件表中        for (j = 0; j < numevents; j++) {            int mask = 0;            struct epoll_event *e = state->events+j;            // 根据就绪的事件类型,设置mask            if (e->events & EPOLLIN) mask |= AE_READABLE;            if (e->events & EPOLLOUT) mask |= AE_WRITABLE;            if (e->events & EPOLLERR) mask |= AE_WRITABLE;            if (e->events & EPOLLHUP) mask |= AE_WRITABLE;            // 添加到就绪事件表中            eventLoop->fired[j].fd = e->data.fd;            eventLoop->fired[j].mask = mask;        }    }    // 返回就绪的事件个数    return numevents;}

3. 事件的源码实现




// 事件轮询的主函数void aeMain(aeEventLoop *eventLoop) {    eventLoop->stop = 0;    // 一直处理事件    while (!eventLoop->stop) {        // 执行处理事件之前的函数        if (eventLoop->beforesleep != NULL)            eventLoop->beforesleep(eventLoop);        //处理到时的时间事件和就绪的文件事件        aeProcessEvents(eventLoop, AE_ALL_EVENTS);    }}


// 处理到时的时间事件和就绪的文件事件// 函数返回执行的事件个数int aeProcessEvents(aeEventLoop *eventLoop, int flags){    int processed = 0, numevents;    /* Nothing to do? return ASAP */    // 如果什么事件都没有设置则直接返回    if (!(flags & AE_TIME_EVENTS) && !(flags & AE_FILE_EVENTS)) return 0;    /* Note that we want call select() even if there are no     * file events to process as long as we want to process time     * events, in order to sleep until the next time event is ready     * to fire. */    // 请注意,既然我们要处理时间事件,即使没有要处理的文件事件,我们仍要调用select(),以便在下一次事件准备启动之前进行休眠    // 当前还没有要处理的文件事件,或者设置了时间时间但是没有设置不阻塞标识    if (eventLoop->maxfd != -1 ||        ((flags & AE_TIME_EVENTS) && !(flags & AE_DONT_WAIT))) {        int j;        aeTimeEvent *shortest = NULL;        struct timeval tv, *tvp;        // 如果设置了时间事件而没有设置不阻塞标识        if (flags & AE_TIME_EVENTS && !(flags & AE_DONT_WAIT))            // 获取最近到时的时间事件            shortest = aeSearchNearestTimer(eventLoop);        // 获取到了最早到时的时间事件        if (shortest) {            long now_sec, now_ms;            // 获取当前时间            aeGetTime(&now_sec, &now_ms);            tvp = &tv;            /* How many milliseconds we need to wait for the next             * time event to fire? */            // 等待该时间事件到时所需要的时长            long long ms =                (shortest->when_sec - now_sec)*1000 +                shortest->when_ms - now_ms;            // 如果没到时            if (ms > 0) {                // 保存时长到tvp中                tvp->tv_sec = ms/1000;                tvp->tv_usec = (ms % 1000)*1000;            // 如果已经到时,则将tvp的时间设置为0            } else {                tvp->tv_sec = 0;                tvp->tv_usec = 0;            }        // 没有获取到了最早到时的时间事件,时间事件链表为空        } else {            /* If we have to check for events but need to return             * ASAP because of AE_DONT_WAIT we need to set the timeout             * to zero */            // 如果设置了不阻塞标识            if (flags & AE_DONT_WAIT) {                // 将tvp的时间设置为0,就不会阻塞                tv.tv_sec = tv.tv_usec = 0;                tvp = &tv;            } else {                // 阻塞到第一个时间事件的到来                /* Otherwise we can block */                tvp = NULL; /* wait forever */            }        }        // 等待所监听文件描述符上有事件发生        // 如果tvp为NULL,则阻塞在此,否则等待tvp设置阻塞的时间,就会有时间事件到时        // 返回了就绪文件事件的个数        numevents = aeApiPoll(eventLoop, tvp);        // 遍历就绪文件事件表        for (j = 0; j < numevents; j++) {            // 获取就绪文件事件的地址            aeFileEvent *fe = &eventLoop->events[eventLoop->fired[j].fd];            // 获取就绪文件事件的类型,文件描述符            int mask = eventLoop->fired[j].mask;            int fd = eventLoop->fired[j].fd;            int rfired = 0;        /* note the fe->mask & mask & ... code: maybe an already processed             * event removed an element that fired and we still didn't             * processed, so we check if the event is still valid. */            // 如果是文件可读事件发生            if (fe->mask & mask & AE_READABLE) {                // 设置读事件标识 且 调用读事件方法处理读事件                rfired = 1;                fe->rfileProc(eventLoop,fd,fe->clientData,mask);            }            // 如果是文件可写事件发生            if (fe->mask & mask & AE_WRITABLE) {                // 读写事件的执行发法不同,则执行写事件,避免重复执行相同的方法                if (!rfired || fe->wfileProc != fe->rfileProc)                    fe->wfileProc(eventLoop,fd,fe->clientData,mask);            }            processed++;    //执行的事件次数加1        }    }    /* Check time events */    // 执行时间事件    if (flags & AE_TIME_EVENTS)        processed += processTimeEvents(eventLoop);    return processed; /* return the number of processed file/time events */}


#define AE_FILE_EVENTS 1                                //文件事件#define AE_TIME_EVENTS 2                                //时间事件#define AE_ALL_EVENTS (AE_FILE_EVENTS|AE_TIME_EVENTS)   //文件和时间事件#define AE_DONT_WAIT 4                                  //不阻塞等待标识


  • 如果flags = 0,函数什么都不做,直接返回
  • 如果flags设置了 AE_ALL_EVENTS ,则执行所有类型的事件
  • 如果flags设置了 AE_FILE_EVENTS ,则执行文件事件
  • 如果flags设置了 AE_TIME_EVENTS ,则执行时间事件
  • 如果flags设置了 AE_DONT_WAIT ,那么函数处理完事件后直接返回,不阻塞等待

Redis服务器在没有被事件触发时,就会阻塞等待,因为没有设置AE_DONT_WAIT标识。但是他不会一直的死等待,等待文件事件的到来,因为他还要处理时间时间,因此,在调用aeApiPoll进行监听之前,先从时间事件表中获取一个最近到达的时间时间,根据要等待的时间构建一个struct timeval tv, *tvp结构的变量,这个变量保存着服务器阻塞等待文件事件的最长时间,一旦时间到达而没有触发文件事件,aeApiPoll函数就会停止阻塞,进而调用processTimeEvents处理时间事件,因为Redis服务器设定一个对自身资源和状态进行检查的周期性检查的时间事件,而该函数就是timeProc所指向的回调函数

int serverCron(struct aeEventLoop *eventLoop, long long id, void *clientData)



void acceptTcpHandler(aeEventLoop *el, int fd, void *privdata, int mask)void acceptUnixHandler(aeEventLoop *el, int fd, void *privdata, int mask)void sendReplyToClient(aeEventLoop *el, int fd, void *privdata, int mask)void readQueryFromClient(aeEventLoop *el, int fd, void *privdata, int mask)
  • acceptTcpHandler:用于accept client的connect
  • acceptUnixHandler:用于acceptclient的本地connect
  • sendReplyToClient:用于向client发送命令回复。
  • readQueryFromClient:用于读入client发送的请求。


// 寻找第一个快到时的时间事件// 这个操作是有用的知道有多少时间可以选择该事件设置为不用推迟任何事件的睡眠中。// 如果事件链表没有时间将返回NULL。static aeTimeEvent *aeSearchNearestTimer(aeEventLoop *eventLoop){    // 时间事件头节点地址    aeTimeEvent *te = eventLoop->timeEventHead;    aeTimeEvent *nearest = NULL;    // 遍历所有的时间事件    while(te) {        // 寻找第一个快到时的时间事件,保存到nearest中        if (!nearest || te->when_sec < nearest->when_sec ||                (te->when_sec == nearest->when_sec &&                 te->when_ms < nearest->when_ms))            nearest = te;        te = te->next;    }    return nearest;}


/* Process time events */// 执行时间事件static int processTimeEvents(aeEventLoop *eventLoop) {    int processed = 0;    aeTimeEvent *te, *prev;    long long maxId;    time_t now = time(NULL);    // 这里尝试发现时间混乱的情况,上一次处理事件的时间比当前时间还要大    // 重置最近一次处理事件的时间    if (now < eventLoop->lastTime) {        te = eventLoop->timeEventHead;        while(te) {            te->when_sec = 0;            te = te->next;        }    }    // 设置上一次时间事件处理的时间为当前时间    eventLoop->lastTime = now;    prev = NULL;    te = eventLoop->timeEventHead;    maxId = eventLoop->timeEventNextId-1;   //当前时间事件表中的最大ID    // 遍历时间事件链表    while(te) {        long now_sec, now_ms;        long long id;        /* Remove events scheduled for deletion. */        // 如果时间事件已被删除了        if (te->id == AE_DELETED_EVENT_ID) {            aeTimeEvent *next = te->next;            // 从事件链表中删除事件的节点            if (prev == NULL)                eventLoop->timeEventHead = te->next;            else                prev->next = te->next;            // 调用时间事件终结方法清楚该事件            if (te->finalizerProc)                te->finalizerProc(eventLoop, te->clientData);            zfree(te);            te = next;            continue;        }        // 确保我们不处理在此迭代中由时间事件创建的时间事件。 请注意,此检查目前无效:我们总是在头节点添加新的计时器,但是如果我们更改实施细节,则该检查可能会再次有用:我们将其保留在未来的防御        if (te->id > maxId) {            te = te->next;            continue;        }        // 获取当前时间        aeGetTime(&now_sec, &now_ms);        // 找到已经到时的时间事件        if (now_sec > te->when_sec ||            (now_sec == te->when_sec && now_ms >= te->when_ms))        {            int retval;            id = te->id;            // 调用时间事件处理方法            retval = te->timeProc(eventLoop, id, te->clientData);            // 时间事件次数加1            processed++;            // 如果不是定时事件,则继续设置它的到时时间            if (retval != AE_NOMORE) {                aeAddMillisecondsToNow(retval,&te->when_sec,&te->when_ms);            // 如果是定时时间,则retval为-1,则将其时间事件删除,惰性删除            } else {                te->id = AE_DELETED_EVENT_ID;            }        }        // 更新前驱节点指针和后继节点指针        prev = te;        te = te->next;    }    return processed;   //返回执行事件的次数}


  • 定时事件:让一段程序在指定的时间后执行一次。
  • 周期性事件:让一段程序每隔指定的时间后执行一次。


至此,Redis事件的实现就剖析完毕,但是事件的其他API,例如:创建事件,删除事件,调整事件表的大小等等都没有列出,所有源码的剖析,可以上github上查看:

