每个worker的cycle来自master进程的cycle

来源:互联网 发布:薛之谦回应 知乎 编辑:程序博客网 时间:2024/05/18 15:07

nginx的main函数中

先初始化ngx_log_t log即存放日志描述符,用于输出日志信息;

------------------------------------------------------

pool =ngx_create_pool(NGX_CYCLE_POOL_SIZE, log);

cycle =ngx_pcalloc(pool, sizeof(ngx_cycle_t));

cyclepoolpool

全局指针ngx_cycle = cycle;

------------------------------------------------------

执行NGX_CORE_MODULE类型的module->create_conf(cycle);

cycle->conf_ctx[ngx_modules[i]->index]= rv;

------------------------------------------------------

ngx_conf_t           conf;

conf.pool=pool;

conf.ctx=cycle->conf_ctx空间来着为pool;

conf.cycle =cycle;

执行NGX_CORE_MODULE类型的ngx_command_t;

cmd->set(conf, cmd, conf->ctx[ngx_modules[i]->index]);

ngx_auth_block(ngx_conf_t*cf, ngx_command_t *cmd, void *conf)

ngx_auth_block中可以直接从cf->pool申请空间

再执行NGX_AUTH_MODULE类型模块的m->create_conf(cf);

NGX_AUTH_MODULE类型模块的ngx_command_t的set函数同理;

 

执行NGX_CORE_MODULE类型的module->init_conf(cycle);

 

注意:

每个worker进程中的cycle均来自父进程即main中的cycle

ngx_worker_process_cycle执行所有模块的init_process(cycle)

 

ngx_calloc是直接malloc的

 

每个worker进程的cycle来自父进程,那么当从cycle->pool中申请空间时候,如何理解?

#include<stdio.h>#include<string.h>#include<stdlib.h>#include<unistd.h>main(){    char str[4]="asd";    pid_t pid=fork();    if(pid==0){        str[0]='b';        printf("子进程中str=%s\n",str);        printf("子进程中str指向的首地址:%x\n",(unsigned int)str);    }    else{        sleep(1);        printf("父进程中str=%s\n",str);        printf("父进程中str指向的首地址:%x\n",(unsigned int)str);    }}

输出:

子进程中str=bsd
子进程中str指向的首地址:bfc224dc
父进程中str=asd
父进程中str指向的首地址:bfc224dc

 

这里就涉及到物理地址和逻辑地址(或称虚拟地址)的概念,从逻辑地址到物理地址的映射称为地址重定向。分为:

静态重定向--在程序装入主存时已经完成了逻辑地址到物理地址和变换,在程序执行期间不会再发生改变。

动态重定向--程序执行期间完成,其实现依赖于硬件地址变换机构,如基址寄存器。

逻辑地址:CPU所生成的地址。CPU产生的逻辑地址被分为 :p (页号) 它包含每个页在物理内存中的基址,用来作为页表的索引;d (页偏移),同基址相结合,用来确定送入内存设备的物理内存地址。

物理地址:内存单元所看到的地址。

用户程序看不见真正的物理地址。用户只生成逻辑地址,且认为进程的地址空间为0max。物理地址范围从R+0R+max,R为基地址,地址映射-将程序地址空间中使用的逻辑地址变换成内存中的物理地址的过程。由内存管理单元(MMU)来完成。

  fork()会产生一个和父进程完全相同的子进程,但子进程在此后多会exec系统调用,出于效率考虑,linux中引入了“写时复制“技术,也就是只有进程空间的各段的内容要发生变化时,才会将父进程的内容复制一份给子进程。在fork之后exec之前两个进程用的是相同的物理空间(内存区),子进程的代码段、数据段、堆栈都是指向父进程的物理空间,也就是说,两者的虚拟空间不同,但其对应的物理空间是同一个。当父子进程中有更改相应段的行为发生时,再为子进程相应的段分配物理空间,如果不是因为exec,内核会给子进程的数据段、堆栈段分配相应的物理空间(至此两者有各自的进程空间,互不影响),而代码段继续共享父进程的物理空间(两者的代码完全相同)。而如果是因为exec,由于两者执行的代码不同,子进程的代码段也会分配单独的物理空间。
       fork之后内核会通过将子进程放在队列的前面,以让子进程先执行,以免父进程执行导致写时复制,而后子进程执行exec系统调用,因无意义的复制而造成效率的下降。

fork时子进程获得父进程数据空间、堆和栈的复制,所以变量的地址(当然是虚拟地址)也是一样的

每个进程都有自己的虚拟地址空间(当然也是从自己进程空间中的堆空间cycle->pool开始处申请的),不同进程的相同的虚拟地址显然可以对应不同的物理地址。因此地址相同(虚拟地址)而值不同没什么奇怪。
具体过程是这样的:
fork子进程完全复制父进程的栈空间,也复制了页表,但没有复制物理页面,所以这时虚拟地址相同,物理地址也相同,但是会把父子共享的页面标记为“只读”(类似mmap的private的方式),如果父子进程一直对这个页面是同一个页面,知道其中任何一个进程要对共享的页面“写操作”,这时内核会复制一个物理页面给这个进程使用,同时修改页表。而把原来的只读页面标记为“可写”,留给另外一个进程使用。

这就是所谓的“写时复制”。正因为fork采用了这种写时复制的机制,所以fork出来子进程之后,父子进程哪个先调度呢?内核一般会先调度子进程,因为很多情况下子进程是要马上执行exec,会清空栈、堆。。这些和父进程共享的空间,加载新的代码段。。。,这就避免了“写时复制”拷贝共享页面的机会。如果父进程先调度很可能写共享页面,会产生“写时复制”的无用功。所以,一般是子进程先调度滴。



0 0
原创粉丝点击