[kernel 启动流程] 前篇——vmlinux.lds分析
来源:互联网 发布:树莓派gpio python 编辑:程序博客网 时间:2024/06/06 01:21
以下例子都以project X项目tiny210(s5pv210平台,armv7架构)为例
[kernel 启动流程]系列:
- [kernel 启动流程] 前篇——vmlinux.lds分析
- [kernel 启动流程] (第一章)概述
- [kernel 启动流程] (第二章)第一阶段之——设置SVC、关闭中断
- [kernel 启动流程] (第三章)第一阶段之——proc info的获取
- [kernel 启动流程] (第四章)第一阶段之——dtb的验证
- [kernel 启动流程] (第五章)第一阶段之——临时内核页表的创建
- [kernel 启动流程] (第六章)第一阶段之——打开MMU
- [kernel 启动流程] (第七章)第一阶段之——跳转到start_kernel
建议参考文档:
- ARMV7官方数据手册
- ARM的CP15协处理器的寄存器
================================================
一、基础部分
1、段说明
- text段
代码段,通常是指用来存放程序执行代码的一块内存区域。这部分区域的大小在程序运行前就已经确定。 - data段
数据段,通常是指用来存放程序中已初始化的全局变量的一块内存区域。数据段属于静态内存分配。 - bss段
通常是指用来存放程序中未初始化的全局变量和静态变量的一块内存区域。BSS段属于静态内存分配。 - init段
linux定义的一种初始化过程中才会用到的段,一旦初始化完成,那么这些段所占用的内存会被释放掉,后续会继续说明
2、各种地址说明
- 地址解释
- 加载地址:程序中指令和变量等加载到RAM上的地址。
- 运行地址:CPU执行一条程序中指令时的执行地址,也就是PC寄存器中的值。更简单的讲,就是要寻址到一个指令或者变量所使用的地址。
- 链接地址:链接过程中链接器为指令和变量分配的地址。
- 地址之间联系
注意,运行地址并不一定完全和链接地址相同,也不一定完全和加载地址相同。- 如果没有打开MMU,并且使用的是位置相关设计,那么加载地址、运行地址、链接地址三者需要一致。
需要保证链接地址和加载地址是一致的,否则会导致程序跑飞,从uboot上可以理解。 - 当打开MMU之前,如果使用的是位置无关设计,那么运行地址和加载地址应该是一致的
例如kernel在打开mmu之前,使用的是位置无关设计,其运行地址和加载地址一致。关于位置无关设计请自行度娘。 - 如果打开了MMU,那么运行地址和链接地址相同。
硬件会根据运行地址进行计算并自动寻址到对应的加载地址上。
- 如果没有打开MMU,并且使用的是位置相关设计,那么加载地址、运行地址、链接地址三者需要一致。
- 举例说明
以s5pv210为例- uboot(BL2)阶段并没有打开MMU,并且其使用的是位置相关设计,所以其加载地址和链接地址都需要设置成相同,
也就是加载地址是0x23E00000,链接地址也是0x23E00000,运行地址也就和这两者一致,也就是 - kernel启动过程中,在MMU打开之前,使用的是位置无关设计,
内核镜像加载地址是0x20008000,链接地址是0xc0008000,运行地址是0x20008000. - 打开MMU之后,
内核镜像加载地址是0x20008000,链接地址是0xc0008000,运行地址是0xc0008000.
- uboot(BL2)阶段并没有打开MMU,并且其使用的是位置相关设计,所以其加载地址和链接地址都需要设置成相同,
二、链接脚本语言
直接上一个简单的vmlinux.lds.S的例子
http://blog.csdn.net/u010246947/article/details/9413275
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
第3行指示,链接地址为0x100000;即指定了后面的text段的链接地址
__第4行指示:输出文件的text段内容由所有目标文件(,理解为所有的.o文件,.o)的text段组成;
注意理解.text : { (.text) }的用法,冒号前面.text表示这个段的名称,{.text}则表示所有目标文件的text段.__
第5行指示:链接地址变了,变为0x8000000;即重新指定了后面的data段的链接地址;
第6行指示:输出文件的data端由所有目标文件的data段组成;
第7行指示:输出文件的bss端由所有目标文件的bss段组成;
三、vmlinux.lds.S分析
__关于vmlinux.lds.S的分析我不建议直接去从头看到尾。
在本文里面也是先分析一个大的框架,然后在第四节和第五节中分析一些细节和例子。__
0、一些有助于我们分析vmlinux.lds.S的东西
- kernel在启动过程中会打印一些和memory信息相关的log
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
这部分log在mm/page_alloc.c中的mem_init_print_info函数中打印。
这里我们着重关注连接过程中的一些段的位置:
- 1
- 2
- 3
- 4
- 编译之后生成的System.map文件
System.map是内核的内核符号表,在这里可以找到函数地址,变量地址,包括一些链接过程中的地址定义等等,
build/out/linux/System.map(这里列出一些关键部分)
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
可以看出和上述(1)中是匹配的。
- 通过反汇编命令对vmlinux进行反汇编,可以解析出详细的汇编代码,包括了一些地址
指令如下:
- 1
- 通过arm-readelf -s vmlinux查看各个段的布局
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
1、整体的段结构
vmlinux.lds.S的段基本上会按照如下格式进行组织。
参考include/asm-generic/vmlinux.lds.h注释部分
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
如上述描述,主要分成了几个区间
* __init_begin - __init_end区间:
内核把一些初始化才会使用到的段(并不局限于数据段或者代码段,也可以是自己定义的段),简称初始化相关段,放在这个区间里,一旦初始化完成,那么这个区间里的数据或代码在后面就不会被使用,内核会把这部分内存释放出来。
* _stext - _etext区间:
存放内核的代码段,正文
* _sdata - _edata区间:
存放data段,包括只读data段和可读可写数据段。
* bss段
2、__init_begin - __init_end区间定义段
arch/arm/kernel/vmlinux.lds.S
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
在__init_begin和__init_end之间定义了很多初始化过程中会使用到的段。具体例子在后面会说明。
从System.map可以看到对应地址如下:
- 1
- 2
- 疑问:为什么exit也放在这里?
- 补充知识:
这个区间的内存会在初始化完成后被free,具体代码在init/main.c
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
3、_stext - _etext区间定义段
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
注意_stext和_etext的定义位置。但是真正的文本段是从_text开始的。
各部分的代码段都被放到了这个区间,注意,只读数据段也放到这里来了。
从System.map可以看到对应地址如下:
- 1
- 2
- 3
- 4
4、_sdata - _edata区间
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
注意_sdata和_edata的定义位置。
各部分的数据段都被放到了这个区间。
从System.map可以看到对应地址如下:
- 1
- 2
- 3
5、bss段定义
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
从System.map看出对应地址如下:
- 1
- 2
四、vmlinux.lds.S更多说明
1、入口
有很多不同的方法来设置入口点.链接器会通过按顺序尝试一下方法来设置入口点,如果成功了,就会停止.
<1> ’-e’ 入口命令行选项
<2> 链接脚本中的ENTRY(SYMBOL)命令
<3> 如果定义了start,就使用start的值
<4> 如果存在就使用’.text’段的首地址
<5> 地址’0’
arm/arch/kernel/vmlinux.lds.S指定入口地址如下:
- 1
说明其入口地址是stext,在arch/arm/kernel/head.S中。
注意:也就是说kernel启动的入口在这里,后续分析kernel启动流程就是从这里开始分析的。
2、连接地址
为什么stext的地址是0xc0008000呢?(通过System.map查看的)。
链接器是通过vmlinux.lds.S链接脚本来进行地址定义的。但是如果起始地址不为0的话,我们需要在链接脚本中为其指定一个起始地址。
arm/arch/kernel/vmlinux.lds.S指定起始连接地址如下(所谓的起始连接地址就是在入口的时候对’.’进行赋值):
- 1
- PAGE_OFFSET表示内核空间的起始地址。
定义位置如下:
./arch/arm/include/asm/memory.h
- 1
- 2
CONFIG_PAGE_OFFSET在配置Kconfig的时候会被设置
arch/arm/Kconfig
- 1
- 2
- 3
- 4
- 5
- 6
- 7
默认情况下是0xC0000000。可以通过配置VMSPLIT来进行修改。
* TEXT_OFFSET表示内核在RAM中的起始位置相对于RAM起始地址偏移。
定义位置如下:
./arch/arm/Makefile
- 1
- 2
- 3
- 4
- 5
也就是说默认情况下是0x00008000。
拓展:为什么要有0x8000的偏移?
因为kernel镜像的前16K需要预留出来给初始化页表项使用。这里先暂时了解一下,后续研究kernel启动流程会遇到,再学习。
对应代码arch/arm/kernel/head.S,这里的注释也提到了。
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
五、例子:initcall
1、说明
initcall的功能和使用不详细说明了,简单一个例子如下:
- 1
initcall又分成很多等级,各个等级主要是调度时机不一样,core_initcall也属于其中一个等级
include/linux/init.h
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
2、段链接位置
include/asm-generic/vmlinux.lds.h
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
*(.initcall##level##.init),例如level为1,则表示由所有目标文件中的.initcall1.init段组成。
所以代码中所要实现的,就是往.initcall1.init这个段里添加数据结构。
查看System.map文件,__initcall1_start符号如下
- 1
- 2
- 3
- 4
- 5
- 6
- 7
3、initcall实现(往initcall段里添加数据结构)
include/linux/init.h
以arch_initcall为例:
- 1
- 2
- 3
- 4
- 5
core_initcall(pm_init);定义了一个名称为__initcall_pm_init1的initcall_t的数据结构,并且放在.initcall1.init段中。
也就实现了上述2说的,往.initcall1.init这个段里添加数据结构。
4、initcall段的使用
- kernel把几个initcall的段的起始地址都放到__initdata中:
init/main.c
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
__initcall#_start存放了每个initcall段的起始地址。
通过上述结构体,就将__initcall1.init段中的数据结构放在__initcall1_start结构体里面了。
并且将所有initcall段里的数据结构initcall_t统一放到了initcall_levels里。
* 调度流程如下
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
从initcall_levels获取各个initcall数据段的起始地址__initcall_start,然后调用do_one_initcall进行执行。
通过如上,就完成了initcall的段中的函数调用。
七、例子:以__earlycon_table为例
在《earlycon实现流程》中我们知道earlycon_id都是被存放到__earlycon_table段中。
以下我们看__earlycon_table段是怎么被链接的。
1、添加一个数据结构到一个段中。
- 1
- 2
定义如下:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
拓展为:attribute ((section(__earlycon_table))),使用__earlycon_table段来存放数据结构。
2、这个段的数据的使用
- 1
- 2
- 3
- 4
- 5
直接获取__earlycon_table和__earlycon_table_end,符号表中会找到这两个地址,earlycon_id的数据结构就放在这里面。
3、__earlycon_table段的连接过程
include/asm-generic/vmlinux.lds.h
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
(__earlycon_table) 由所有输入文件(,理解为所有的.o文件,*.o)的__earlycon_table段组成;
- 1
- 2
- 3
- 4
- 5
arch/arm/kernel/vmlinux.lds.S
- 1
- 2
- 3
- 4
- 5
- 6
- 7
可以观察到是放在init区间中的。
4、通过System.map查看这个段的定义位置
build/out/linux/System.map
- [kernel 启动流程] 前篇——vmlinux.lds分析
- [kernel 启动流程] 前篇——vmlinux.lds分析
- vmlinux.lds.s文件分析
- vmlinux.lds.s文件分析
- ARM架构内核启动分析-head.S(1.1、vmlinux.lds 链接脚本分析)
- vmlinux.lds
- vmlinux.lds
- vmlinux.lds
- arch/arm/kernel下的vmlinux.lds的生成
- vmlinux.lds解读
- vmlinux.lds文件
- vmlinux.lds解读
- vmlinux.lds解读
- vmlinux.lds解读
- vmlinux.lds的理解
- vmlinux.lds.S
- vmlinux.lds.S
- ARM Linux启动流程分析——start_kernel前启动阶段(汇编部分)
- iOS Action Extension
- MyBatis学习之入门篇
- c++学习:指针
- mongodb在windows上安装以及注意事项
- 集群调优
- [kernel 启动流程] 前篇——vmlinux.lds分析
- python3 函数参数
- 网络桥接及链路聚合
- String 类
- 一些简单函数的作用
- 随机森林
- 湖大坑爹期中考试。
- [kernel 启动流程] (第一章)概述
- 机器学习基石-Three Learning Principles