Android的init过程：init.rc解析流程

来源：互联网发布：mac双系统分区编辑：程序博客网时间：2024/05/16 12:47

这几天打算看下安卓的代码，看优秀的源码也是一种学习过程，看源码的过程就感觉到，安卓确实是深受linux内核的影响，不少数据结构的用法完全一致。花了一中午时间，研究了下init.rc解析过程，做个记录。

init.rc 文件并不是普通的配置文件，而是由一种被称为“Android初始化语言”（Android Init Language，这里简称为AIL）的脚本写成的文件。在了解init如何解析init.rc文件之前，先了解AIL非常必要，否则机械地分析 init.c及其相关文件的源代码毫无意义。

为了学习AIL，读者可以到自己Android手机的根目录寻找init.rc文件，最好下载到本地以便查看，如果有编译好的Android源代码，在<Android源代码根目录>out/target/product/generic/root目录也可找到init.rc文件。

AIL由如下4部分组成。

1. 动作（Actions）

2. 命令（Commands）

3．服务（Services）

4. 选项（Options）

这4部分都是面向行的代码，也就是说用回车换行符作为每一条语句的分隔符。而每一行的代码由多个符号（Tokens）表示。可以使用反斜杠转义符在 Token中插入空格。双引号可以将多个由空格分隔的Tokens合成一个Tokens。如果一行写不下，可以在行尾加上反斜杠，来连接下一行。也就是说，可以用反斜杠将多行代码连接成一行代码。

AIL的注释与很多Shell脚本一行，以#开头。

AIL在编写时需要分成多个部分（Section），而每一部分的开头需要指定Actions或Services。也就是说，每一个Actions或 Services确定一个Section。而所有的Commands和Options只能属于最近定义的Section。如果Commands和 Options在第一个Section之前被定义，它们将被忽略。

Actions和Services的名称必须唯一。如果有两个或多个Action或Service拥有同样的名称，那么init在执行它们时将抛出错误，并忽略这些Action和Service。

下面来看看Actions、Services、Commands和Options分别应如何设置。

Actions的语法格式如下：

on <trigger>     <command>     <command>     <command>

也就是说Actions是以关键字on开头的，然后跟一个触发器，接下来是若干命令。例如，下面就是一个标准的Action。

on boot          ifup lo          hostname localhost          domainname localdomain

Services （服务）是一个程序，他在初始化时启动，并在退出时重启（可选）。Services （服务）的形式如下：

service <name> <pathname> [ <argument> ]*            <option>            <option>

例如，下面是一个标准的Service用法

service servicemanager /system/bin/servicemanager          class core          user system          group system          critical          onrestart restart zygote          onrestart restart media          onrestart restart surfaceflinger          onrestart restart drm

现在接着分析一下init是如何解析init.rc的。现在打开system/core/init/init.c文件，找到main函数。在上一篇文章中分析了main函数的前一部分（初始化属性、处理内核命令行等），现在找到init_parse_config_file函数，调用代码如下：

init_parse_config_file("/init.rc");

这个方法主要负责初始化和分析init.rc文件。init_parse_config_file函数在init_parser.c文件中实现，代码如下：

int init_parse_config_file(const char *fn)      {          char *data;          data = read_file(fn, 0);          if (!data) return -1;          /*  实际分析init.rc文件的代码  */          parse_config(fn, data);          DUMP();          return 0;      }

读取文件read_file有个地方需要注意：它把init.rc内容读取到data指向的buffer当中，它会在buffer最后追加两个字符：\n和\0。并且在linux系统需要注意的是，每行的结束仅仅有一个字符\n。

static void parse_config(const char *fn, char *s)      {          struct parse_state state;          struct listnode import_list;          struct listnode *node;          char *args[INIT_PARSER_MAXARGS];          int nargs;                nargs = 0;          state.filename = fn;          state.line = 0;          state.ptr = s;          state.nexttoken = 0;          state.parse_line = parse_line_no_op;                list_init(&import_list);          state.priv = &import_list;          /*  开始获取每一个token，然后分析这些token，每一个token就是有空格、字表符和回车符分隔的字符串        */          for (;;) {              /*  next_token函数相当于词法分析器  */              switch (next_token(&state)) {              case T_EOF:  /*  init.rc文件分析完毕  */                  state.parse_line(&state, 0, 0);                  goto parser_done;              case T_NEWLINE:  /*  分析每一行的命令  */                  /*  下面的代码相当于语法分析器  */                  state.line++;                  if (nargs) {                      int kw = lookup_keyword(args[0]);                      if (kw_is(kw, SECTION)) {                          state.parse_line(&state, 0, 0);                          parse_new_section(&state, kw, nargs, args);                      } else {                          state.parse_line(&state, nargs, args);                      }                      nargs = 0;                  }                  break;              case T_TEXT:  /*  处理每一个token  */                  if (nargs < INIT_PARSER_MAXARGS) {                      args[nargs++] = state.text;                  }                  break;              }          }            parser_done:          /*  最后处理由import导入的初始化文件  */          list_for_each(node, &import_list) {               struct import *import = node_to_item(node, struct import, list);               int ret;                     INFO("importing '%s'", import->filename);               /*  递归调用  */                ret = init_parse_config_file(import->filename);               if (ret)                   ERROR("could not import file '%s' from '%s'\n",                         import->filename, fn);          }      }

parse_config的代码比较复杂了，现在先说说该方法的基本处理流程。首先会调用list_init(&import_list)初始化一个链表，该链表用于存储通过import语句导入的初始化文件名。然后开始在for循环中分析init.rc文件中的每一行代码。最后init.rc分析完之后，就会进入parse_done部分，并递归调用init_parse_config_file方法分析通过import导入的初始化文件。

for循环中调用next_token不断从init.rc文件中获取token，这里的token，就是一种编程语言的最小单位，也就是不可再分。例如，对于传统的编程语言的if、then等关键字、变量名等标识符都属于一个token。而对于init.rc文件来说，import、on以及触发器的参数值都是属于一个token。一个解析器要进行语法和词法的分析，词法分析就是在文件中找出一个个的token，也就是说，词法分析器的返回值是token，而语法分析器的输入就是词法分析器的输出。也就是说，语法分析器就需要分析一个个的token,而不是一个个的字符。词法分析器就是next_token,而语法分析器就是T_NEWLINE分支中的代码。下面我们来看看next_token是怎么获取一个个的token的。

int next_token(struct parse_state *state)      {          char *x = state->ptr;          char *s;                if (state->nexttoken) {              int t = state->nexttoken;              state->nexttoken = 0;              return t;          }          /*  在这里开始一个字符一个字符地分析  */          for (;;) {              switch (*x) {              case 0:                  state->ptr = x;                  return T_EOF;              case '\n':                  x++;                  state->ptr = x;                  return T_NEWLINE;              case ' ':              case '\t':              case '\r':                  x++;                  continue;              case '#':                  while (*x && (*x != '\n')) x++;                  if (*x == '\n') {                      state->ptr = x+1;                      return T_NEWLINE;                  } else {                      state->ptr = x;                      return T_EOF;                  }              default:                  goto text;              }          }            textdone:          state->ptr = x;          *s = 0;          return T_TEXT;      text:          state->text = s = x;      textresume:          for (;;) {              switch (*x) {              case 0:                  goto textdone;              case ' ':              case '\t':              case '\r':                  x++;                  goto textdone;              case '\n':                  state->nexttoken = T_NEWLINE;                  x++;                  goto textdone;              case '"':                  x++;                  for (;;) {                      switch (*x) {                      case 0:                              /* unterminated quoted thing */                          state->ptr = x;                          return T_EOF;                      case '"':                          x++;                          goto textresume;                      default:                          *s++ = *x++;                      }                  }                  break;              case '\\':                  x++;                  switch (*x) {                  case 0:                      goto textdone;                  case 'n':                      *s++ = '\n';                      break;                  case 'r':                      *s++ = '\r';                      break;                  case 't':                      *s++ = '\t';                      break;                  case '\\':                      *s++ = '\\';                      break;                  case '\r':                          /* \ <cr> <lf> -> line continuation */                      if (x[1] != '\n') {                          x++;                          continue;                      }                  case '\n':                          /* \ <lf> -> line continuation */                      state->line++;                      x++;                          /* eat any extra whitespace */                      while((*x == ' ') || (*x == '\t')) x++;                      continue;                  default:                          /* unknown escape -- just copy */                      *s++ = *x++;                  }                  continue;              default:                  *s++ = *x++;              }          }          return T_EOF;      }

next_token的代码还是蛮多的，不过原理到很简单。就是逐一读取init.rc文件的字符，并将由空格、/t分隔的字符串挑出来，并通过state_text返回，并通过state->text返回。如果返回正常的token，next_token就返回T_TEXT。如果一行结束，就返回T_NEWLINE，并开始语法分析，特别注意：init初始化语言是基于行的，所以语言分析实际上就是分析init.rc的每一行，只是这些行已经被分解成一个个的token并保存在args数组当中。
现在回到parse_config函数，先看一下T_TEXT分支。该分支讲获得每一行的token都存储在args数组中。现在来看T_NEWLINE分支。该分支的代码涉及到一个state.parse_line函数指针，该函数指针指向的函数负责具体的分析工作。但我们发现，一看是该函数指针指向了一个空函数，实际上一开始该函数什么都不做。

现在来回顾一下T_NEWLINE分支的完整代码

case T_NEWLINE:          state.line++;          if (nargs) {              int kw = lookup_keyword(args[0]);              if (kw_is(kw, SECTION)) {                  state.parse_line(&state, 0, 0);                  parse_new_section(&state, kw, nargs, args);              } else {                  state.parse_line(&state, nargs, args);              }              nargs = 0;          }          break;

上面的代码首先调用lookup_keyword搜索关键字，该方法的作用是判定当前行是否合法：也就是根据init初始化预定义的关键字查询，如果没有查到返回K_UNKNOWN。如果当前行合法，则会执行parse_new_section函数，该函数将为section和action设置处理函数。代码如下：

void parse_new_section(struct parse_state *state, int kw,                             int nargs, char **args)      {          printf("[ %s %s ]\n", args[0],                 nargs > 1 ? args[1] : "");          switch(kw) {          case K_service:  //  处理service              state->context = parse_service(state, nargs, args);              if (state->context) {                  state->parse_line = parse_line_service;                  return;              }              break;          case K_on:  //  处理action              state->context = parse_action(state, nargs, args);              if (state->context) {                  state->parse_line = parse_line_action;                  return;              }              break;          case K_import:   //  单独处理import导入的初始化文件。              parse_import(state, nargs, args);              break;          }          state->parse_line = parse_line_no_op;      }

我们拿case K_service举例：首先调用parse_service函数，该函数代码如下：

static void *parse_service(struct parse_state *state, int nargs, char **args){    struct service *svc;    if (nargs < 3) {        parse_error(state, "services must have a name and a program\n");        return 0;    }    if (!valid_name(args[1])) {        parse_error(state, "invalid service name '%s'\n", args[1]);        return 0;    }    svc = service_find_by_name(args[1]);    if (svc) {        parse_error(state, "ignored duplicate definition of service '%s'\n", args[1]);        return 0;    }    nargs -= 2;    svc = calloc(1, sizeof(*svc) + sizeof(char*) * nargs);    if (!svc) {        parse_error(state, "out of memory\n");        return 0;    }    svc->name = args[1];    svc->classname = "default";    memcpy(svc->args, args + 2, sizeof(char*) * nargs);    svc->args[nargs] = 0;    svc->nargs = nargs;    svc->onrestart.name = "onrestart";    list_init(&svc->onrestart.commands);    list_add_tail(&service_list, &svc->slist);    return svc;}

该函数先判定当前行参数个数，比如service daemon /system/bin/daemon，此时刚好满足条件，参数刚刚是三个，第一个是service关键字，第二个参数是服务名，第三个参数是服务所在的路径。然后调用service_find_by_name在serivce_list队列查找当前行的服务是否已经添加过队列，如果添加过即svc!=NULL,那么就报错；最后最重要的一点，填充svc结构体的内容，并将其添加到service_list双向链表当中。在填充结构体的内容的时候需要注意的点是：srv->args[]数组的内容，只保存参数，什么意思呢？举个例子，比如init.rc中有这么一行代码：service dumpstate /system/bin/dumpstate -s，那么刚进入到parse_service函数的时候，nargs=4。但是svc的args数组只需要保存/system/bin/dumpstate -s这两个参数就好了！！

然后会重新设置state->parse_line，比如对于service的section解析来说，state->parse_line = parse_line_service；这样就会调用parse_line_service解析services的options。

没有图像的分析总显得不够直观，下面使用具体例子说明在执行完毕parse_service和parse_line_service时的组织结构图：

service zygote ....

onrestart write /sys/android..

onrestart write /sys/power..

onrestart restart media

图片取自《深入理解安卓》一书。

从上图可知：

1）service_list链表讲解析之后的service全部链接到一起，并且是双向链表

2）onrestart通过commands也构造一个双向链表，如果service下面具有onrestart的option，那么会将选项挂接到onrestart其中的链表当中。

0 0