skynet源码分析（5）--消息机制之消息处理

来源：互联网发布：苹果手机变音软件编辑：程序博客网时间：2024/05/18 04:01

作者:shihuaping0918@163.com，转载请注明作者

skynet的消息机制准备拆成三个部分来讲，第一部分是接收处理，第二部分是分发，第三部分是消息注册。顺序是倒过来的讲的，我觉得这样更容易被人接受理解。顺过来讲会有一个问题就是，讲到a时，可能牵扯到b.c.d，而b.c.d可能又牵扯到c.d.e，不讲呢又会留下疑惑，讲的话呢又很容易陷入细节的泥潭。干脆就倒过来讲好了。

skynet是单进程多线程的，线程的种类有monitor/timer/socket/worker，monitor在第4篇中讲过了，就是监控服务是不是陷入死循环了。timer是skynet自己实现的定时器。socket是负责网络的，这个应该是最容易被理解的。worker就是工作线程了，monitor/timer/socket都只有一个线程，唯独worker有多个线程，是可配的，不配的话是8个线程。每个工作线程有个叫worker_parm的参数。

在开始讲线程之前还需要回顾一下消息队列，在第2篇中讲过全局消息队列是链表，里面链了工作消息队列，而工作消息队列内部使用的是循环数组。

另外还要回顾一下消息的handle，每个服务都有运行时一个独一无二的handle，这个handle可以跟名字绑定。

好，准备工作差不多完成了，上面提到的都是分析代码所要具备的知识。上代码吧，源码之前了无秘密。

static void *thread_worker(void *p) {    struct worker_parm *wp = p;//线程参数    int id = wp->id; //线程编号    int weight = wp->weight; //线程权重    struct monitor *m = wp->m; //monitor，监控器，每个线程有一个    struct skynet_monitor *sm = m->m[id]; // 线程自己的监控器    skynet_initthread(THREAD_WORKER);    struct message_queue * q = NULL;    while (!m->quit) {//消息处理        q = skynet_context_message_dispatch(sm, q, weight);        if (q == NULL) { //所有消息队列都是空的            if (pthread_mutex_lock(&m->mutex) == 0) {                ++ m->sleep;                // "spurious wakeup" is harmless,                // because skynet_context_message_dispatch() can be call at any time.                if (!m->quit) //不退出的时候等待唤醒                    pthread_cond_wait(&m->cond, &m->mutex);                -- m->sleep;                if (pthread_mutex_unlock(&m->mutex)) {                    fprintf(stderr, "unlock mutex error");                    exit(1);                }            }        }    }    return NULL;}

上面的代码没涉及太多业务，注意传进去的q刚开始是null。下面看skynet_context_message_dispatch

struct message_queue * skynet_context_message_dispatch(struct skynet_monitor *sm, struct message_queue *q, int weight) {    if (q == NULL) { //第一次传进来的是null        q = skynet_globalmq_pop(); //全局队列出队一个工作消息队列        if (q==NULL)            return NULL;    }    //消息队列的handle，就是服务的标识    uint32_t handle = skynet_mq_handle(q);    //根据handle取出服务上下文，并将ctx引用计数+1    struct skynet_context * ctx = skynet_handle_grab(handle);    if (ctx == NULL) {  //服务被释放了？        struct drop_t d = { handle };        skynet_mq_release(q, drop_message, &d); //清空工作队列        return skynet_globalmq_pop(); //进行下一个工作队列    }    int i,n=1;    struct skynet_message msg;    for (i=0;i<n;i++) {        if (skynet_mq_pop(q,&msg)) { //取工作队列中的消息            skynet_context_release(ctx); //工作队列是空的，ctx引用计数减1            return skynet_globalmq_pop(); //下一个工作队列        } else if (i==0 && weight >= 0) { //权重 > 0            n = skynet_mq_length(q);            n >>= weight; //权重越大，给的处理时间越少        }        //取overlad值，然后把mq里的overload设为0        //就是防止无限打下面这条日志        int overload = skynet_mq_overload(q);         if (overload) {            skynet_error(ctx, "May overload, message queue length = %d", overload);        }        //在分析monitor时讲过        //触发monitor，monitor线程会检查是不是进入死循环        skynet_monitor_trigger(sm, msg.source , handle);        //如果服务都没提供回调        if (ctx->cb == NULL) {            skynet_free(msg.data);        } else {//消息处理            dispatch_message(ctx, &msg);        }        //调用结束了，当destination为0的时候，不进行死循环检查        skynet_monitor_trigger(sm, 0,0);    }     //下面这段代码是时间片流转    //把处理机会让给其它服务    assert(q == ctx->queue);    struct message_queue *nq = skynet_globalmq_pop();    if (nq) { //如果全局队列里还有工作队列        // If global mq is not empty , push q back, and return next queue (nq)        // Else (global mq is empty or block, don't push q back, and return q again (for next dispatch)        skynet_globalmq_push(q); //把当前队列放回去        q = nq; //把机会让给其它工作队列，雷锋啊    }     skynet_context_release(ctx); //ctx引用计数减1    return q;}

先不继续分析dispatch_message，先总结一下，skynet_context_message_dispatch这个函数实际上就是不停地从全局消息队列里取工作队列，取到了以后呢，就一直处理这个队列里的消息。为了避免某个队列占用太多cpu，当前队列处理到一定的量，就把机会让给全局消息队列里的其它工作队列，把自己又放回全局消息队列。而这个处理的量是根据创建线程时thread_param里的weight权重来判定的，权重越大，流转的就越快，也就是说处理某个队列的消息数量就越少。这就是消息处理的主流程机制。

在主流程之外，还有monitor的触发和取消，每次处理前，触发monitor的检查。处理完了，取消monitor的检查。

大体流程清楚了以后，歇口气。可以抽根烟喝杯茶再继续，后面的内容简单些了。下面分析dispatch_message。

static voiddispatch_message(struct skynet_context *ctx, struct skynet_message *msg) {    assert(ctx->init);    CHECKCALLING_BEGIN(ctx)    pthread_setspecific(G_NODE.handle_key, (void *)(uintptr_t)(ctx->handle));    int type = msg->sz >> MESSAGE_TYPE_SHIFT; //消息类型，是请求包还是回应包，参考云风的博客    size_t sz = msg->sz & MESSAGE_TYPE_MASK; //防止sz过长    if (ctx->logfile) { //打日志        skynet_log_output(ctx->logfile, msg->source, type, msg->session, msg->data, sz);    }    ++ctx->message_count;    int reserve_msg;    if (ctx->profile) { //profile        ctx->cpu_start = skynet_thread_time();        reserve_msg = ctx->cb(ctx, ctx->cb_ud, type, msg->session, msg->source, msg->data, sz); //调用服务里的回调函数        uint64_t cost_time = skynet_thread_time() - ctx->cpu_start;        ctx->cpu_cost += cost_time; //cpu时间消耗    } else {        reserve_msg = ctx->cb(ctx, ctx->cb_ud, type, msg->session, msg->source, msg->data, sz); //调用服务里的消息回调函数    }    if (!reserve_msg) {        skynet_free(msg->data);    }    CHECKCALLING_END(ctx)}

阅读全文

0 0