嵌入式Linux--内存管理单元MMU

来源:互联网 发布:手机淘宝有淘宝直通车 编辑:程序博客网 时间:2024/05/01 12:40

平台:JZ2440

地址映射
首先来看两个简单的程序

//hello.c#include <stdio.h>int a = 3;int main(int argc, char *argv[]){    printf("Hello World!\n");    printf("a's address = %p, val = %d\n", &a, a);    while(1);    return 0;}
//hello2.c#include <stdio.h>int a = 3;int main(int argc, char *argv[]){    printf("Hello World2!\n");    printf("a's address = %p, val = %d\n", &a, a);    while(1);    return 0;}

编译运行后结果如下图:
这里写图片描述
(这里讲一个小插曲,我用的是Linux系统,在shell中执行,而shell有行缓存机制,也就是printf不足一行的内容是不会打印出来的,之前程序中第二句printf结尾没有加’\n’,导致a的地址和值一直打印不出来)
两个独立的程序同时运行,a的地址都是一样的,为什么会这样?
这其中存在着地址映射,下面用一张图来说明问题:
这里写图片描述
a的地址0x601040其实是一个虚拟地址,通过相应的地址映射转换成实际的物理地址,这样让两个程序看上去好像在同一空间里跑一样,其实他们都有自己独立的地址空间,互相不能访问。
我们在写程序时提到的地址一般也都是虚拟地址(也不排除时物理地址,如果没有启用地址映射,那就是物理地址),CPU从程序中读出地址,发送读写数据指令,此时读出的地址是虚拟地址,经过地址映射转换成物理地址,读取数据后返回给CPU。进行虚拟地址和物理地址转换的模块,叫做MMU–内存管理单元。
地址映射总结起来就是下面这张图:
这里写图片描述
当没有启用地址映射时,CPU操作的都是实际的物理地址;启用了地址映射以后,CPU操作的是间接地址–虚拟地址。可想而知,地址映射可以将不连续的物理地址映射到连续的虚拟地址上供CPU操作。

讲了这么多地址映射的概念,那到底是怎么完成地址映射的呢?
地址映射可以有两种方法:
1、虚拟地址(VA)和物理地址(PA)通过一定的书写表达式转换:VA = fun(PA),
2、通过一张表,将虚拟地址和物理地址的对应存放起来,这样的表叫做页表页表由一个个条目组成,每个条目存储了一段虚拟地址对应的物理地址,及其访问权限,或者下一级页表的地址,在ARM的CPU中使用第二种方法,我们就来讲讲最简单的段映射。
段映射可以通俗的理解为页表被分成一段一段的内容,每一段的大小是1M,段里面存放的内容是实际的物理地址,则一段代表1M的物理地址。这里写图片描述
需要注意的是每个段的起始地址都是1M的整数倍
那么我们该如何建立映射呢?总共分为三步:
1、建立映射表格
2、将映射表格的地址告诉MMU
3、启动MMU
下面通过程序详细讲解这三步:
程序有一下内容这里写图片描述

  • head.S是启动程序,用汇编代码编写
  • init.c用于初始化存储、mmu等相关内容
  • leds.c是用户的应用程序
  • mmu.lds是一个连接文件,里面说明了上述三个文件应该运行在哪些地址中
  • Makefile是Linux特有的文件,用于定义编译规则,不是本次关注的重点
    首先来讲讲链接文件mmu.lds,先贴代码
SECTIONS {   firtst    0x00000000 : { head.o init.o }  second    0xB0004000 : AT(2048) { leds.o }} 

我们可以看到他将程序分成了两个段
- first:包含head.S和init.c编译后的文件,他们运行在虚拟地址0x00000000处
- second:包含实际的应用程序,它运行在虚拟地址0xB0004000
其中second段中还有一个AT(2048)这样的东西,这又是什么呢?
我们程序编译完成后会制作成一个mmu.bin文件烧写到开发板上运行,假如说first在mmu.bin文件中的位置是0x00000000处,那么second就位于文件的first+2048处,AT(2048)也就是距离first的偏移量。这里写图片描述

启动文件head.S:

@*************************************************************************@ File:head.S@ 功能:设置SDRAM,将第二部分代码复制到SDRAM,设置页表,启动MMU,@       然后跳到SDRAM继续执行@*************************************************************************       .text.global _start_start:    ldr sp, =4096                       @ 设置栈指针,以下都是C函数,调用前需要设好栈    bl  disable_watch_dog               @ 关闭WATCHDOG,否则CPU会不断重启    bl  memsetup                        @ 设置存储控制器以使用SDRAM    bl  copy_2th_to_sdram               @ 将第二部分代码复制到SDRAM    bl  create_page_table               @ 设置页表    bl  mmu_init                        @ 启动MMU    ldr sp, =0xB4000000                 @ 重设栈指针,指向SDRAM顶端(使用虚拟地址)    ldr pc, =0xB0004000                 @ 跳到SDRAM中继续执行第二部分代码    @ ldr pc, =mainhalt_loop:    b   halt_loop

启动文件第一步做的是设置栈,它将栈设置在了片内SRAM的顶部;接着关闭看门狗。
下面是设置存储控制器以使用SDRAM,我们的映射表和应用程序leds.c就是在SDRAM中。我们就来看一下memsetup函数,在init.c中:

void memsetup(void){    /* SDRAM 13个寄存器的值 */    unsigned long  const    mem_cfg_val[]={ 0x22011110,     //BWSCON                                            0x00000700,     //BANKCON0                                            0x00000700,     //BANKCON1                                            0x00000700,     //BANKCON2                                            0x00000700,     //BANKCON3                                              0x00000700,     //BANKCON4                                            0x00000700,     //BANKCON5                                            0x00018005,     //BANKCON6                                            0x00018005,     //BANKCON7                                            0x008C07A3,     //REFRESH                                            0x000000B1,     //BANKSIZE                                            0x00000030,     //MRSRB6                                            0x00000030,     //MRSRB7                                    };    int     i = 0;    volatile unsigned long *p = (volatile unsigned long *)MEM_CTL_BASE;    for(; i < 13; i++)        p[i] = mem_cfg_val[i];}

我们可以看到程序中将13个值一次填入存储控制器相关的寄存器,这一系列的操作可以理解为配置存储控制器从而可以让我们使用SDRAM,这13个值具体是什么含义可以参考S3C2440A的芯片手册。
让我们回过头来再看head.S,执行完memsetup后接着执行copy_2th_to_sdram函数,将second段拷贝到SDRAM中,同样代码在init.c文件中:

void copy_2th_to_sdram(void){    unsigned int *pdwSrc  = (unsigned int *)2048;    unsigned int *pdwDest = (unsigned int *)0x30004000;    while (pdwSrc < (unsigned int *)4096)    {        *pdwDest = *pdwSrc;        pdwDest++;        pdwSrc++;    }}

在讲这个之前想简单讲一讲NAND Flash启动的流程:
我们编译好的程序mmu.bin存放在nand flash的0地址处,当内核开始运行时,会自动将nand的头4K内容拷贝到片内的4k大小SRAM中运行,也就是将head.o、init.o和leds.o拷贝到了内存当中,其中head.o位于内存0地址处,那么leds.o就位于2048处,所以拷贝工作从内存的2048处开始,直到内存结尾,将内容拷贝到SDRAM的0x30004000处。
可是不是说好second段要运行在0xB0004000处吗,怎么又在0x30004000处了,崩溃!那是因为0xB0004000是虚拟地址,我们之后会把0x30004000映射到0xB0004000地址上,也就是说这两个地址指向的都是同一处。

拷贝完second段以后启动文件又告诉CPU该执行create_page_table函数了,这个也就是今天的主角,制作映射表!

/* * 设置页表 */void create_page_table(void){/*  * 用于段描述符的一些宏定义 */ #define MMU_FULL_ACCESS     (3 << 10)   /* 访问权限 */#define MMU_DOMAIN          (0 << 5)    /* 属于哪个域 */#define MMU_SPECIAL         (1 << 4)    /* 必须是1 */#define MMU_CACHEABLE       (1 << 3)    /* cacheable */#define MMU_BUFFERABLE      (1 << 2)    /* bufferable */#define MMU_SECTION         (2)         /* 表示这是段描述符 */#define MMU_SECDESC         (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \                             MMU_SECTION)#define MMU_SECDESC_WB      (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \                             MMU_CACHEABLE | MMU_BUFFERABLE | MMU_SECTION)#define MMU_SECTION_SIZE    0x00100000    unsigned long virtuladdr, physicaladdr;    unsigned long *mmu_tlb_base = (unsigned long *)0x30000000;    /*     * Steppingstone的起始物理地址为0,第一部分程序的起始运行地址也是0,     * 为了在开启MMU后仍能运行第一部分的程序,     * 将0~1M的虚拟地址映射到同样的物理地址     */    virtuladdr = 0;    physicaladdr = 0;    *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \                                            MMU_SECDESC_WB;    /*     * 0x56000000是GPIO寄存器的起始物理地址,     * GPFCON和GPFDAT这两个寄存器的物理地址0x56000050、0x56000054,     * 为了在第二部分程序中能以地址0xA0000050、0xA0000054来操作GPFCON、GPFDAT,     * 把从0xA0000000开始的1M虚拟地址空间映射到从0x56000000开始的1M物理地址空间     */    virtuladdr = 0xA0000000;    physicaladdr = 0x56000000;    *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \                                            MMU_SECDESC;    /*     * SDRAM的物理地址范围是0x30000000~0x33FFFFFF,     * 将虚拟地址0xB0000000~0xB3FFFFFF映射到物理地址0x30000000~0x33FFFFFF上,     * 总共64M,涉及64个段描述符     */    virtuladdr = 0xB0000000;    physicaladdr = 0x30000000;    while (virtuladdr < 0xB4000000)    {        *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \                                                MMU_SECDESC_WB;        virtuladdr += 0x100000;        physicaladdr += 0x100000;    }}

我们总共设置了三段地址映射,第一段是将物理地址0x00000000映射到虚拟地址0x00000000,因为first“应该”运行在0x00000000,所以我们将first的物理地址(0x00000000)映射到虚拟地址0x00000000处,假如first实际 的地址不在0x00000000处,那么就要将它的实际地址映射到虚拟0x00000000处,保证让cpu认为他是在0x00000000处;第二段是映射GPF的寄存器地址,我们知道要使led闪烁需要操作它的寄存器来设置它的输出值,只就需要知道寄存器的具体地址(物理地址),当我们把它们映射到虚拟地址时,我们只需要操作虚拟地址就可以访问到他们,GPFCON的物理地址是0x56000050,GPFDAT的物理地址是0x56000054,将他们映射到0xA0000050和0xA0000054上;第三段是将SDRAM的地址映射到0xB0000000上,这样我们的second段就在0xB0004000地址上了。

设置完映射表以后就有启动MMU啦,贴上代码:

void mmu_init(void){    unsigned long ttb = 0x30000000;// ARM体系架构与编程// 嵌入汇编:LINUX内核完全注释__asm__(    "mov    r0, #0\n"    "mcr    p15, 0, r0, c7, c7, 0\n"    /* 使无效ICaches和DCaches */    "mcr    p15, 0, r0, c7, c10, 4\n"   /* drain write buffer on v4 */    "mcr    p15, 0, r0, c8, c7, 0\n"    /* 使无效指令、数据TLB */    "mov    r4, %0\n"                   /* r4 = 页表基址 */    "mcr    p15, 0, r4, c2, c0, 0\n"    /* 设置页表基址寄存器 */    "mvn    r0, #0\n"                       "mcr    p15, 0, r0, c3, c0, 0\n"    /* 域访问控制寄存器设为0xFFFFFFFF,                                         * 不进行权限检查                                          */        /*      * 对于控制寄存器,先读出其值,在这基础上修改感兴趣的位,     * 然后再写入     */    "mrc    p15, 0, r0, c1, c0, 0\n"    /* 读出控制寄存器的值 */    /* 控制寄存器的低16位含义为:.RVI ..RS B... .CAM     * R : 表示换出Cache中的条目时使用的算法,     *     0 = Random replacement;1 = Round robin replacement     * V : 表示异常向量表所在的位置,     *     0 = Low addresses = 0x00000000;1 = High addresses = 0xFFFF0000     * I : 0 = 关闭ICaches;1 = 开启ICaches     * R、S : 用来与页表中的描述符一起确定内存的访问权限     * B : 0 = CPU为小字节序;1 = CPU为大字节序     * C : 0 = 关闭DCaches;1 = 开启DCaches     * A : 0 = 数据访问时不进行地址对齐检查;1 = 数据访问时进行地址对齐检查     * M : 0 = 关闭MMU;1 = 开启MMU     */    /*       * 先清除不需要的位,往下若需要则重新设置它们         */                                        /* .RVI ..RS B... .CAM */     "bic    r0, r0, #0x3000\n"          /* ..11 .... .... .... 清除V、I位 */    "bic    r0, r0, #0x0300\n"          /* .... ..11 .... .... 清除R、S位 */    "bic    r0, r0, #0x0087\n"          /* .... .... 1... .111 清除B/C/A/M */    /*     * 设置需要的位     */    "orr    r0, r0, #0x0002\n"          /* .... .... .... ..1. 开启对齐检查 */    "orr    r0, r0, #0x0004\n"          /* .... .... .... .1.. 开启DCaches */    "orr    r0, r0, #0x1000\n"          /* ...1 .... .... .... 开启ICaches */    "orr    r0, r0, #0x0001\n"          /* .... .... .... ...1 使能MMU */    "mcr    p15, 0, r0, c1, c0, 0\n"    /* 将修改的值写入控制寄存器 */    : /* 无输出 */    : "r" (ttb) );}

注意程序开始有一句话:

unsigned long ttb = 0x30000000;

这句话是存储我们映射表的地址,在之后的操作中会告诉MMU。其他的指令可以查看相关资料,推荐《ARM体系架构与编程》。

初始化完MMU以后,把sp指针指向0xB4000000,此时这个地址就是虚拟地址了,它指向虚拟内存的顶部,pc指针指向0xB0004000,这是我们存放leds.o的地方,也就是跳向了main函数。

完成以后系统就会执行leds.c中的内容,操作led灯,我们发现使用虚拟内存后灯闪烁的更快了,那是应为MMU有DCACH和ICACH功能,加快程序的运行

原创粉丝点击