ARM Architecture C 语言寻址解析—— 从U-Boot relocation所展开的探索（一）

来源：互联网发布：优先队列最短路径算法编辑：程序博客网时间：2024/06/06 18:07

ARM Architecture C 语言寻址解析——
从U-Boot relocation所展开的探索（一）

by 蔡于清

文章的名字有点长也有点拗口，但它却很好的表达了本文的主题和来历。这个主题将讨论和分析ARM架构上C语言对变量和函数的寻址方式，为什么要讨论这个主题？或者说为什么会想到去讨论这个主题？答案就在文章的副标题，没错，因为U-Boot。这段时间本人在移植U-Boot2011.12到自家的OMAP3平台上，早在ARM9时代就接触过U-Boot，当时没有仔细研究，兴趣所致，这次我读起了她的源代码，其中有一个特性引起我的注意，这个特性就是同一份U-Boot代码被加载在不同的内存空间运行，简单说就是U-Boot的运行基地址可以不同于其连接基地址（比如连接时指定的基地址处于Flash空间而运行时基地址处在RAM空间），这就带来一个问题——”CPU如何进行寻址？“。对于一个普通的完整的可运行的bin 文件，必须在生成它的时候（一般是在link阶段）指定其连接基地址，一般而言连接基地址等同于运行基地址（也等同于加载地址），如果运行地址与连接地址不同，则寻址必将发生错误，而U-Boot却可以被整体的从一个内存段搬运到另一个内存段，并顺利地运行，她是如何做到的呢？——答案是relocotion（重定位），那么U-Boot又是如何进行relocation的呢？好奇心的驱使，我决定弄个明白，于是就有了这个主题——ARM寻址解析。

这个主题分三个部分讲解（每一部分单独成章，本文为第一章）：

ARM Architecture C语言寻址方式解析(GNU ARM Tool Chain with No PIC compile option)。
ARM Architecture C语言寻址方式解析(GNU ARM Tool Chain with PIC compile option)。
U-Boot Relocation解析。

本系列文章使用如下工具和源码：

host ：ubuntu 10.04 LTS
target：beagleboard
cross toolchain：arm-2011.09-69-arm-none-eabi
例程：arm_pic
U-Boot Src：u-boot-2011.12

如果读者具备以下经验，则读起来会舒服很多：

熟悉 ARM Architecture C 语言
熟悉ARM Architecture 汇编语言
会使用arm cross toolchain
了解System V ELF format
了解ELF for ARM Arch
有实际U-Boot开发经验

我们使用arm_pic作为解析例程，第一，二部分的探讨基本上都围绕arm_pic工程展开，arm_pic的连接基本地址在arm_pic.lds中被指定为0x40200000，这个地址是OMAP3的OnChip SRAM起始地址，入口地址为start.S中的”_start:”，随后进入main函数，细节很简单，具体请阅读源码，可以从这里下载arm_pic。该工程由下列文件组成：

Makeconfig（编译配置）
Makefile（编译脚本）
arm_pic.lds（连接脚本）
start.S（汇编源文件）
main.c（C源文件）

命令行进入arm_pic目录，make，得到以下文件：

arm_pic（elf格式文件）
arm_pic.bin（二进制镜像文件）
arm_pic.dump（反汇编文件）
arm_pic.map（Memory Map文件）

ARM Architecture C语言寻址方式解析
(GNU ARM Tool Chain with No PIC compile option)

先分析arm_pic全局变量的内存分布，下图是arm_pic.dump文件中关于.rodata 数据段，.data 数据段以及.bss数据段的截图。

C变量名数据段地址初始值

global_var1 .data 0x40200150 0x11111111

global_str .data 0x40200154 0x40200134

global_var2 .bss 0x4020015c 0x00000000

可以看到global_var1，global_str是已初始化的全局变量，被存放在.data数据段中，其中global_var1的初始值为0x11111111。global_str初始值为0x40200134，在main.c中，global_str被定义为一个指针，其初始值0x40200134应该是一个地址值，仔细观察可以发现，0x40200134地址的内存空间所存放的数据正是字符串”this is a test for arm_pic”（字符串为只读数据，存放在.rodata数据段），这与main.c中global_str的定义一致，既global_str指向字符串”this is a test for arm_pic”。global_var2是未初始化全局变量，存放在.bss数据段中，被默认初始化为0x00000000。好像标漏了一个变量global_data_length，不知读者看出它在哪里了吗？global_data_length是一个未被初始化的全局变量，所以它应该落在.bss数据段中，它的地址正是0x40200158。

接下来我们分析main函数，下图是arm_pic.dump文件中关于main函数的截图和说明。

先观察0x40200128，0x4020012c，0x40200130这三个内存空间的值，这三个内存空间的值分别是global_var1，global_var2，global_str三个全局变量的地址，这三个内存空间并不是由程序员分配或定义，而是gcc编译器自己产生，我们暂时人为的把这三个内存空间命名为Lable1，Lable2，Lable3，这类由编译器自己产生的用于存放变量地址的Lable非常重要（U-Boot通过修改这种Lable中的值完成relocation），再次强调，这里的Lable指的是0x40200128，0x4020012c，0x40200130内存空间，其中的值是变量地址。从上图中可以看到，CPU对global_var1，global_var2，global_str三者的寻址方式相同，都是通过基于pc的相对位置取得Lable的地址，从而取得相应的变量地址(Lable的内存值），需要注意，因为ARM流水线的机制，每一道指令当前的pc值应该是当前指令地址值 + 8。接下来看foo函数跳转，如0x40200110地址所示，其指令为“bl 40200098”，这就是调用foo函数的指令，"bl"是相对寻址的跳转指令（target_address = pc + offset），这样我们可以得出结论，ARM Architecture C语言的函数调用指令使用的是相对寻址的bl指令，与被调用函数的绝对位置无关。OK，现在思考一个问题，arm_pic的运行基地址在连接时被指定为0x40200000，如果我们把她像U-Boot一样整体copy到另一个地址运行（比如0x80000000，offset = 0x80000000 - 0x40200000 = 0x3fe00000），这样行的通吗？不行，这样为出错。为什么？我们看一看copy后的内存分布，如下图所示:

main函数起始地址处于0x800000e4。因为使用相对寻址的"bl"指令进行函数调用，所以foo函数调用没问题，问题出在global_var1，global_var2，global_str的寻址，这三者的新地址应该是: 原地址＋ offset，于是有：
global_var1新地址：0x40200150 + 0x3fe00000 = 0x80000150
global_var2新地址：0x4020015c + 0x3fe00000 = 0x8000015c
global_var3新地址：0x40200154 + 0x3fe00000 = 0x80000154
从指令我们可以看出，对这三个变量进行寻址得到的是原来老的地址，问题就出在：存放变量地址的Lable内存空间，这部分内存空间的值（全局变量地址）在编译的时候已经被确定下来。

这样的代码是不可能像U-Boot一样被运行在任意地址段的。那是不是能产生一种可以运行在任意地址段的代码呢？有，这就是第二篇文章要讨论的内容——Position-Independent Code（PIC）。

TO BE CONTINUE... ...

/*
   * fix .rel.dyn relocations
   */
ldr r0, _TEXT_BASE /* r0 <- Text base */
sub r9, r6, r0 /* r9 <- relocation offset which is from 0x20000000 !!! */
ldr r10, _dynsym_start_ofs /* r10 <- sym table ofs */
add r10, r10, r0 /* r10 <- sym table in FLASH */
ldr r2, _rel_dyn_start_ofs /* r2 <- rel dyn start ofs */
add r2, r2, r0 /* r2 <- rel dyn start in FLASH */
ldr r3, _rel_dyn_end_ofs /* r3 <- rel dyn end ofs */
add r3, r3, r0 /* r3 <- rel dyn end in FLASH */

// r10 : the begining of the sym table in FLASH
// r2  : rel dyn start in FLASH
// r3  : rel dyn end in FLASH
// r9  : offset between flash and ram
// r0  : begining 0f the code in nand flash
// r6  : begining 0f the code in ram
//  fix the rel dyn because the location is changed

我看了一下链接脚本，这两段是由静态链接器产生，含义如下：

rel.dyn：产生位置无关代码时，需要修正的在got段和数据段

.dynsym:动态符号表，动态修正的时候，需要动态符号表。
因为没有动态连接器，所以需要人为进行修正。

我的问题，

第一我看过编译选项，并没有-fPIC选项，为什么会有GOT表出现？

第二 u-boot里用了大量的指针变量，这些指针变量保存着数据地址，也是需要重定位的，应该都保存在data.rel段里，也进行重定位，但我并没有看到这个段，也没进行重定位？？