Nginx源码分析一

来源:互联网 发布:wp软件开发 编辑:程序博客网 时间:2024/05/01 02:15

源码包解压之后,根目录下有几个子目录和几个文件

configure脚本会引用auto目录下面的脚本文件来干活

configure作为一个总驱动,调用这些脚本去生成版本信息头文件、默认被包含的模块的声明代码和Makefile文件,版本信息头文件 (ngx_auto_config.h,ngx_auto_headers.h)和默认被包含的模块的声明代码(ngx_modules.c)被放置在新创建的objs目录下。

src是源码存放的目录,configure创建的objs/src目录是用来存放生成的.o文件的

src/core存放着主干部分、基础数据结构和基础设施的源码,main函数在src/core/nginx.c中

src/event存放着事件驱动模型和相关模块的源码。

src/http存放着http server和相关模块的源码。

src/mail存放着邮件代理和相关模块的源码。

src/misc存放着C++兼容性测试和google perftools模块的源码。

src/os存放着依赖于操作系统实现的源码,nginx启动过程中最重要的master和workers创建代码就在这个目录下



大体上分析源代码都要经历三遍过程,第一遍是浏览,通过阅读源码的文档和注释,阅读接口,先弄清楚每个模块是干什么的而不关心它是怎么做的,画出架构草图;第二遍是精读,根据架构草图把系统分为小部分,每个部分从源码实现自底向上的阅读,更深入细致的理解每个模块的实现方式以及与模块外部的接口方式等,弄明白模块是怎么做的,为什么这样做,有没有更好的方式,自己会如何实现等等问题;第三遍是总结回顾,完善架构图,把架构图中那些模糊的或者空着的模块重新补充完善,把一些可复用的实现放入自己的代码库中。


源码的src/core目录下实现了不少精巧的数据结构,最重要的有:内存池ngx_pool_t、缓冲区ngx_buf_t、缓冲区链 ngx_chain_t、字符串ngx_str_t、数组ngx_array_t、链表ngx_list_t、队列ngx_queue_t、基于hash 的关联数组ngx_hash_t、红黑树ngx_rbtree_t、radix树ngx_radix_tree_t等,这些数据结构频繁出现在源码中,而且这些结构之间也是彼此配合,联系紧密,很难孤立某一个出来。

每个数据结构都提供了一批相关的操作接口,一般设置数据的接口(add)只是从内存池中分配空间并返回指向结构体的指针,然后利用这个指针再去设置成员,这使得此类接口的实现保持干净简洁。


模块化是nginx的骨架,事件处理是nginx的心脏,而每个具体模块构成了nginx的血肉

nginx 的模块在源码中对应着是ngx_module_t结构的变量,有一个全局的ngx_module_t指针数组,这个指针数组包含了当前编译版本支持的所有模块,这个指针数组的定义是在自动脚本生成的objs/ngx_modules.c文件中

纵观整个nginx的代码,可以大致分为三块,一块是一些重要的数据结构及其操作接口,代码主要在src/core和src/os/unix目录下;第二块是模块的实现,四个种类几十个模块的实现分散在src/core、src/event、src/http、src/mail目录下;第三块是启动过程的代码,上一篇也大致列了一下启动调用的函数序列,其代码分布在src/core和src/os/unix目录下






0 0