嵌入式Linux--内存管理单元MMU

来源：互联网发布：手机淘宝有淘宝直通车编辑：程序博客网时间：2024/05/01 12:40

平台：JZ2440

地址映射
首先来看两个简单的程序

//hello.c#include <stdio.h>int a = 3;int main(int argc, char *argv[]){    printf("Hello World!\n");    printf("a's address = %p, val = %d\n", &a, a);    while(1);    return 0;}

//hello2.c#include <stdio.h>int a = 3;int main(int argc, char *argv[]){    printf("Hello World2!\n");    printf("a's address = %p, val = %d\n", &a, a);    while(1);    return 0;}

编译运行后结果如下图：
这里写图片描述
（这里讲一个小插曲，我用的是Linux系统，在shell中执行，而shell有行缓存机制，也就是printf不足一行的内容是不会打印出来的，之前程序中第二句printf结尾没有加’\n’,导致a的地址和值一直打印不出来）
两个独立的程序同时运行，a的地址都是一样的，为什么会这样？
这其中存在着地址映射，下面用一张图来说明问题：
这里写图片描述
a的地址0x601040其实是一个虚拟地址，通过相应的地址映射转换成实际的物理地址，这样让两个程序看上去好像在同一空间里跑一样，其实他们都有自己独立的地址空间，互相不能访问。
我们在写程序时提到的地址一般也都是虚拟地址（也不排除时物理地址，如果没有启用地址映射，那就是物理地址），CPU从程序中读出地址，发送读写数据指令，此时读出的地址是虚拟地址，经过地址映射转换成物理地址，读取数据后返回给CPU。进行虚拟地址和物理地址转换的模块，叫做MMU–内存管理单元。
地址映射总结起来就是下面这张图：
这里写图片描述
当没有启用地址映射时，CPU操作的都是实际的物理地址；启用了地址映射以后，CPU操作的是间接地址–虚拟地址。可想而知，地址映射可以将不连续的物理地址映射到连续的虚拟地址上供CPU操作。

讲了这么多地址映射的概念，那到底是怎么完成地址映射的呢？
地址映射可以有两种方法：
1、虚拟地址(VA)和物理地址(PA)通过一定的书写表达式转换：VA = fun(PA),
2、通过一张表，将虚拟地址和物理地址的对应存放起来，这样的表叫做页表页表由一个个条目组成，每个条目存储了一段虚拟地址对应的物理地址，及其访问权限，或者下一级页表的地址，在ARM的CPU中使用第二种方法，我们就来讲讲最简单的段映射。
段映射可以通俗的理解为页表被分成一段一段的内容，每一段的大小是1M，段里面存放的内容是实际的物理地址，则一段代表1M的物理地址。这里写图片描述
需要注意的是每个段的起始地址都是1M的整数倍
那么我们该如何建立映射呢？总共分为三步：
1、建立映射表格
2、将映射表格的地址告诉MMU
3、启动MMU
下面通过程序详细讲解这三步：
程序有一下内容

head.S是启动程序，用汇编代码编写
init.c用于初始化存储、mmu等相关内容
leds.c是用户的应用程序
mmu.lds是一个连接文件，里面说明了上述三个文件应该运行在哪些地址中
Makefile是Linux特有的文件，用于定义编译规则，不是本次关注的重点
首先来讲讲链接文件mmu.lds，先贴代码

SECTIONS {   firtst    0x00000000 : { head.o init.o }  second    0xB0004000 : AT(2048) { leds.o }}

我们可以看到他将程序分成了两个段
- first：包含head.S和init.c编译后的文件，他们运行在虚拟地址0x00000000处
- second：包含实际的应用程序，它运行在虚拟地址0xB0004000
其中second段中还有一个AT(2048)这样的东西，这又是什么呢？
我们程序编译完成后会制作成一个mmu.bin文件烧写到开发板上运行，假如说first在mmu.bin文件中的位置是0x00000000处，那么second就位于文件的first+2048处，AT（2048）也就是距离first的偏移量。这里写图片描述

启动文件head.S:

@*************************************************************************@ File：head.S@ 功能：设置SDRAM，将第二部分代码复制到SDRAM，设置页表，启动MMU，@       然后跳到SDRAM继续执行@*************************************************************************       .text.global _start_start:    ldr sp, =4096                       @ 设置栈指针，以下都是C函数，调用前需要设好栈    bl  disable_watch_dog               @ 关闭WATCHDOG，否则CPU会不断重启    bl  memsetup                        @ 设置存储控制器以使用SDRAM    bl  copy_2th_to_sdram               @ 将第二部分代码复制到SDRAM    bl  create_page_table               @ 设置页表    bl  mmu_init                        @ 启动MMU    ldr sp, =0xB4000000                 @ 重设栈指针，指向SDRAM顶端(使用虚拟地址)    ldr pc, =0xB0004000                 @ 跳到SDRAM中继续执行第二部分代码    @ ldr pc, =mainhalt_loop:    b   halt_loop

启动文件第一步做的是设置栈，它将栈设置在了片内SRAM的顶部；接着关闭看门狗。
下面是设置存储控制器以使用SDRAM，我们的映射表和应用程序leds.c就是在SDRAM中。我们就来看一下memsetup函数，在init.c中：

void memsetup(void){    /* SDRAM 13个寄存器的值 */    unsigned long  const    mem_cfg_val[]={ 0x22011110,     //BWSCON                                            0x00000700,     //BANKCON0                                            0x00000700,     //BANKCON1                                            0x00000700,     //BANKCON2                                            0x00000700,     //BANKCON3                                              0x00000700,     //BANKCON4                                            0x00000700,     //BANKCON5                                            0x00018005,     //BANKCON6                                            0x00018005,     //BANKCON7                                            0x008C07A3,     //REFRESH                                            0x000000B1,     //BANKSIZE                                            0x00000030,     //MRSRB6                                            0x00000030,     //MRSRB7                                    };    int     i = 0;    volatile unsigned long *p = (volatile unsigned long *)MEM_CTL_BASE;    for(; i < 13; i++)        p[i] = mem_cfg_val[i];}

我们可以看到程序中将13个值一次填入存储控制器相关的寄存器，这一系列的操作可以理解为配置存储控制器从而可以让我们使用SDRAM，这13个值具体是什么含义可以参考S3C2440A的芯片手册。
让我们回过头来再看head.S，执行完memsetup后接着执行copy_2th_to_sdram函数，将second段拷贝到SDRAM中，同样代码在init.c文件中：

void copy_2th_to_sdram(void){    unsigned int *pdwSrc  = (unsigned int *)2048;    unsigned int *pdwDest = (unsigned int *)0x30004000;    while (pdwSrc < (unsigned int *)4096)    {        *pdwDest = *pdwSrc;        pdwDest++;        pdwSrc++;    }}

在讲这个之前想简单讲一讲NAND Flash启动的流程：
我们编译好的程序mmu.bin存放在nand flash的0地址处，当内核开始运行时，会自动将nand的头4K内容拷贝到片内的4k大小SRAM中运行，也就是将head.o、init.o和leds.o拷贝到了内存当中，其中head.o位于内存0地址处，那么leds.o就位于2048处，所以拷贝工作从内存的2048处开始，直到内存结尾，将内容拷贝到SDRAM的0x30004000处。
可是不是说好second段要运行在0xB0004000处吗，怎么又在0x30004000处了，崩溃！那是因为0xB0004000是虚拟地址，我们之后会把0x30004000映射到0xB0004000地址上，也就是说这两个地址指向的都是同一处。

拷贝完second段以后启动文件又告诉CPU该执行create_page_table函数了，这个也就是今天的主角，制作映射表！

/* * 设置页表 */void create_page_table(void){/*  * 用于段描述符的一些宏定义 */ #define MMU_FULL_ACCESS     (3 << 10)   /* 访问权限 */#define MMU_DOMAIN          (0 << 5)    /* 属于哪个域 */#define MMU_SPECIAL         (1 << 4)    /* 必须是1 */#define MMU_CACHEABLE       (1 << 3)    /* cacheable */#define MMU_BUFFERABLE      (1 << 2)    /* bufferable */#define MMU_SECTION         (2)         /* 表示这是段描述符 */#define MMU_SECDESC         (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \                             MMU_SECTION)#define MMU_SECDESC_WB      (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \                             MMU_CACHEABLE | MMU_BUFFERABLE | MMU_SECTION)#define MMU_SECTION_SIZE    0x00100000    unsigned long virtuladdr, physicaladdr;    unsigned long *mmu_tlb_base = (unsigned long *)0x30000000;    /*     * Steppingstone的起始物理地址为0，第一部分程序的起始运行地址也是0，     * 为了在开启MMU后仍能运行第一部分的程序，     * 将0～1M的虚拟地址映射到同样的物理地址     */    virtuladdr = 0;    physicaladdr = 0;    *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \                                            MMU_SECDESC_WB;    /*     * 0x56000000是GPIO寄存器的起始物理地址，     * GPFCON和GPFDAT这两个寄存器的物理地址0x56000050、0x56000054，     * 为了在第二部分程序中能以地址0xA0000050、0xA0000054来操作GPFCON、GPFDAT，     * 把从0xA0000000开始的1M虚拟地址空间映射到从0x56000000开始的1M物理地址空间     */    virtuladdr = 0xA0000000;    physicaladdr = 0x56000000;    *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \                                            MMU_SECDESC;    /*     * SDRAM的物理地址范围是0x30000000～0x33FFFFFF，     * 将虚拟地址0xB0000000～0xB3FFFFFF映射到物理地址0x30000000～0x33FFFFFF上，     * 总共64M，涉及64个段描述符     */    virtuladdr = 0xB0000000;    physicaladdr = 0x30000000;    while (virtuladdr < 0xB4000000)    {        *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \                                                MMU_SECDESC_WB;        virtuladdr += 0x100000;        physicaladdr += 0x100000;    }}

我们总共设置了三段地址映射，第一段是将物理地址0x00000000映射到虚拟地址0x00000000，因为first“应该”运行在0x00000000，所以我们将first的物理地址（0x00000000）映射到虚拟地址0x00000000处，假如first实际的地址不在0x00000000处,那么就要将它的实际地址映射到虚拟0x00000000处，保证让cpu认为他是在0x00000000处；第二段是映射GPF的寄存器地址，我们知道要使led闪烁需要操作它的寄存器来设置它的输出值，只就需要知道寄存器的具体地址（物理地址），当我们把它们映射到虚拟地址时，我们只需要操作虚拟地址就可以访问到他们，GPFCON的物理地址是0x56000050，GPFDAT的物理地址是0x56000054，将他们映射到0xA0000050和0xA0000054上；第三段是将SDRAM的地址映射到0xB0000000上，这样我们的second段就在0xB0004000地址上了。

设置完映射表以后就有启动MMU啦，贴上代码：

void mmu_init(void){    unsigned long ttb = 0x30000000;// ARM体系架构与编程// 嵌入汇编：LINUX内核完全注释__asm__(    "mov    r0, #0\n"    "mcr    p15, 0, r0, c7, c7, 0\n"    /* 使无效ICaches和DCaches */    "mcr    p15, 0, r0, c7, c10, 4\n"   /* drain write buffer on v4 */    "mcr    p15, 0, r0, c8, c7, 0\n"    /* 使无效指令、数据TLB */    "mov    r4, %0\n"                   /* r4 = 页表基址 */    "mcr    p15, 0, r4, c2, c0, 0\n"    /* 设置页表基址寄存器 */    "mvn    r0, #0\n"                       "mcr    p15, 0, r0, c3, c0, 0\n"    /* 域访问控制寄存器设为0xFFFFFFFF，                                         * 不进行权限检查                                          */        /*      * 对于控制寄存器，先读出其值，在这基础上修改感兴趣的位，     * 然后再写入     */    "mrc    p15, 0, r0, c1, c0, 0\n"    /* 读出控制寄存器的值 */    /* 控制寄存器的低16位含义为：.RVI ..RS B... .CAM     * R : 表示换出Cache中的条目时使用的算法，     *     0 = Random replacement；1 = Round robin replacement     * V : 表示异常向量表所在的位置，     *     0 = Low addresses = 0x00000000；1 = High addresses = 0xFFFF0000     * I : 0 = 关闭ICaches；1 = 开启ICaches     * R、S : 用来与页表中的描述符一起确定内存的访问权限     * B : 0 = CPU为小字节序；1 = CPU为大字节序     * C : 0 = 关闭DCaches；1 = 开启DCaches     * A : 0 = 数据访问时不进行地址对齐检查；1 = 数据访问时进行地址对齐检查     * M : 0 = 关闭MMU；1 = 开启MMU     */    /*       * 先清除不需要的位，往下若需要则重新设置它们         */                                        /* .RVI ..RS B... .CAM */     "bic    r0, r0, #0x3000\n"          /* ..11 .... .... .... 清除V、I位 */    "bic    r0, r0, #0x0300\n"          /* .... ..11 .... .... 清除R、S位 */    "bic    r0, r0, #0x0087\n"          /* .... .... 1... .111 清除B/C/A/M */    /*     * 设置需要的位     */    "orr    r0, r0, #0x0002\n"          /* .... .... .... ..1. 开启对齐检查 */    "orr    r0, r0, #0x0004\n"          /* .... .... .... .1.. 开启DCaches */    "orr    r0, r0, #0x1000\n"          /* ...1 .... .... .... 开启ICaches */    "orr    r0, r0, #0x0001\n"          /* .... .... .... ...1 使能MMU */    "mcr    p15, 0, r0, c1, c0, 0\n"    /* 将修改的值写入控制寄存器 */    : /* 无输出 */    : "r" (ttb) );}

注意程序开始有一句话：

unsigned long ttb = 0x30000000;

这句话是存储我们映射表的地址，在之后的操作中会告诉MMU。其他的指令可以查看相关资料，推荐《ARM体系架构与编程》。

初始化完MMU以后，把sp指针指向0xB4000000，此时这个地址就是虚拟地址了，它指向虚拟内存的顶部，pc指针指向0xB0004000，这是我们存放leds.o的地方，也就是跳向了main函数。

完成以后系统就会执行leds.c中的内容，操作led灯，我们发现使用虚拟内存后灯闪烁的更快了，那是应为MMU有DCACH和ICACH功能，加快程序的运行

阅读全文

0 0