嵌入式Linux--内存管理单元MMU
来源:互联网 发布:手机淘宝有淘宝直通车 编辑:程序博客网 时间:2024/05/01 12:40
平台:JZ2440
地址映射
首先来看两个简单的程序
//hello.c#include <stdio.h>int a = 3;int main(int argc, char *argv[]){ printf("Hello World!\n"); printf("a's address = %p, val = %d\n", &a, a); while(1); return 0;}
//hello2.c#include <stdio.h>int a = 3;int main(int argc, char *argv[]){ printf("Hello World2!\n"); printf("a's address = %p, val = %d\n", &a, a); while(1); return 0;}
编译运行后结果如下图:
(这里讲一个小插曲,我用的是Linux系统,在shell中执行,而shell有行缓存机制,也就是printf不足一行的内容是不会打印出来的,之前程序中第二句printf结尾没有加’\n’,导致a的地址和值一直打印不出来)
两个独立的程序同时运行,a的地址都是一样的,为什么会这样?
这其中存在着地址映射,下面用一张图来说明问题:
a的地址0x601040其实是一个虚拟地址,通过相应的地址映射转换成实际的物理地址,这样让两个程序看上去好像在同一空间里跑一样,其实他们都有自己独立的地址空间,互相不能访问。
我们在写程序时提到的地址一般也都是虚拟地址(也不排除时物理地址,如果没有启用地址映射,那就是物理地址),CPU从程序中读出地址,发送读写数据指令,此时读出的地址是虚拟地址,经过地址映射转换成物理地址,读取数据后返回给CPU。进行虚拟地址和物理地址转换的模块,叫做MMU–内存管理单元。
地址映射总结起来就是下面这张图:
当没有启用地址映射时,CPU操作的都是实际的物理地址;启用了地址映射以后,CPU操作的是间接地址–虚拟地址。可想而知,地址映射可以将不连续的物理地址映射到连续的虚拟地址上供CPU操作。
讲了这么多地址映射的概念,那到底是怎么完成地址映射的呢?
地址映射可以有两种方法:
1、虚拟地址(VA)和物理地址(PA)通过一定的书写表达式转换:VA = fun(PA),
2、通过一张表,将虚拟地址和物理地址的对应存放起来,这样的表叫做页表页表由一个个条目组成,每个条目存储了一段虚拟地址对应的物理地址,及其访问权限,或者下一级页表的地址,在ARM的CPU中使用第二种方法,我们就来讲讲最简单的段映射。
段映射可以通俗的理解为页表被分成一段一段的内容,每一段的大小是1M,段里面存放的内容是实际的物理地址,则一段代表1M的物理地址。
需要注意的是每个段的起始地址都是1M的整数倍
那么我们该如何建立映射呢?总共分为三步:
1、建立映射表格
2、将映射表格的地址告诉MMU
3、启动MMU
下面通过程序详细讲解这三步:
程序有一下内容
- head.S是启动程序,用汇编代码编写
- init.c用于初始化存储、mmu等相关内容
- leds.c是用户的应用程序
- mmu.lds是一个连接文件,里面说明了上述三个文件应该运行在哪些地址中
- Makefile是Linux特有的文件,用于定义编译规则,不是本次关注的重点
首先来讲讲链接文件mmu.lds,先贴代码
SECTIONS { firtst 0x00000000 : { head.o init.o } second 0xB0004000 : AT(2048) { leds.o }}
我们可以看到他将程序分成了两个段
- first:包含head.S和init.c编译后的文件,他们运行在虚拟地址0x00000000处
- second:包含实际的应用程序,它运行在虚拟地址0xB0004000
其中second段中还有一个AT(2048)这样的东西,这又是什么呢?
我们程序编译完成后会制作成一个mmu.bin文件烧写到开发板上运行,假如说first在mmu.bin文件中的位置是0x00000000处,那么second就位于文件的first+2048处,AT(2048)也就是距离first的偏移量。
启动文件head.S:
@*************************************************************************@ File:head.S@ 功能:设置SDRAM,将第二部分代码复制到SDRAM,设置页表,启动MMU,@ 然后跳到SDRAM继续执行@************************************************************************* .text.global _start_start: ldr sp, =4096 @ 设置栈指针,以下都是C函数,调用前需要设好栈 bl disable_watch_dog @ 关闭WATCHDOG,否则CPU会不断重启 bl memsetup @ 设置存储控制器以使用SDRAM bl copy_2th_to_sdram @ 将第二部分代码复制到SDRAM bl create_page_table @ 设置页表 bl mmu_init @ 启动MMU ldr sp, =0xB4000000 @ 重设栈指针,指向SDRAM顶端(使用虚拟地址) ldr pc, =0xB0004000 @ 跳到SDRAM中继续执行第二部分代码 @ ldr pc, =mainhalt_loop: b halt_loop
启动文件第一步做的是设置栈,它将栈设置在了片内SRAM的顶部;接着关闭看门狗。
下面是设置存储控制器以使用SDRAM,我们的映射表和应用程序leds.c就是在SDRAM中。我们就来看一下memsetup函数,在init.c中:
void memsetup(void){ /* SDRAM 13个寄存器的值 */ unsigned long const mem_cfg_val[]={ 0x22011110, //BWSCON 0x00000700, //BANKCON0 0x00000700, //BANKCON1 0x00000700, //BANKCON2 0x00000700, //BANKCON3 0x00000700, //BANKCON4 0x00000700, //BANKCON5 0x00018005, //BANKCON6 0x00018005, //BANKCON7 0x008C07A3, //REFRESH 0x000000B1, //BANKSIZE 0x00000030, //MRSRB6 0x00000030, //MRSRB7 }; int i = 0; volatile unsigned long *p = (volatile unsigned long *)MEM_CTL_BASE; for(; i < 13; i++) p[i] = mem_cfg_val[i];}
我们可以看到程序中将13个值一次填入存储控制器相关的寄存器,这一系列的操作可以理解为配置存储控制器从而可以让我们使用SDRAM,这13个值具体是什么含义可以参考S3C2440A的芯片手册。
让我们回过头来再看head.S,执行完memsetup后接着执行copy_2th_to_sdram函数,将second段拷贝到SDRAM中,同样代码在init.c文件中:
void copy_2th_to_sdram(void){ unsigned int *pdwSrc = (unsigned int *)2048; unsigned int *pdwDest = (unsigned int *)0x30004000; while (pdwSrc < (unsigned int *)4096) { *pdwDest = *pdwSrc; pdwDest++; pdwSrc++; }}
在讲这个之前想简单讲一讲NAND Flash启动的流程:
我们编译好的程序mmu.bin存放在nand flash的0地址处,当内核开始运行时,会自动将nand的头4K内容拷贝到片内的4k大小SRAM中运行,也就是将head.o、init.o和leds.o拷贝到了内存当中,其中head.o位于内存0地址处,那么leds.o就位于2048处,所以拷贝工作从内存的2048处开始,直到内存结尾,将内容拷贝到SDRAM的0x30004000处。
可是不是说好second段要运行在0xB0004000处吗,怎么又在0x30004000处了,崩溃!那是因为0xB0004000是虚拟地址,我们之后会把0x30004000映射到0xB0004000地址上,也就是说这两个地址指向的都是同一处。
拷贝完second段以后启动文件又告诉CPU该执行create_page_table函数了,这个也就是今天的主角,制作映射表!
/* * 设置页表 */void create_page_table(void){/* * 用于段描述符的一些宏定义 */ #define MMU_FULL_ACCESS (3 << 10) /* 访问权限 */#define MMU_DOMAIN (0 << 5) /* 属于哪个域 */#define MMU_SPECIAL (1 << 4) /* 必须是1 */#define MMU_CACHEABLE (1 << 3) /* cacheable */#define MMU_BUFFERABLE (1 << 2) /* bufferable */#define MMU_SECTION (2) /* 表示这是段描述符 */#define MMU_SECDESC (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \ MMU_SECTION)#define MMU_SECDESC_WB (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \ MMU_CACHEABLE | MMU_BUFFERABLE | MMU_SECTION)#define MMU_SECTION_SIZE 0x00100000 unsigned long virtuladdr, physicaladdr; unsigned long *mmu_tlb_base = (unsigned long *)0x30000000; /* * Steppingstone的起始物理地址为0,第一部分程序的起始运行地址也是0, * 为了在开启MMU后仍能运行第一部分的程序, * 将0~1M的虚拟地址映射到同样的物理地址 */ virtuladdr = 0; physicaladdr = 0; *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \ MMU_SECDESC_WB; /* * 0x56000000是GPIO寄存器的起始物理地址, * GPFCON和GPFDAT这两个寄存器的物理地址0x56000050、0x56000054, * 为了在第二部分程序中能以地址0xA0000050、0xA0000054来操作GPFCON、GPFDAT, * 把从0xA0000000开始的1M虚拟地址空间映射到从0x56000000开始的1M物理地址空间 */ virtuladdr = 0xA0000000; physicaladdr = 0x56000000; *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \ MMU_SECDESC; /* * SDRAM的物理地址范围是0x30000000~0x33FFFFFF, * 将虚拟地址0xB0000000~0xB3FFFFFF映射到物理地址0x30000000~0x33FFFFFF上, * 总共64M,涉及64个段描述符 */ virtuladdr = 0xB0000000; physicaladdr = 0x30000000; while (virtuladdr < 0xB4000000) { *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \ MMU_SECDESC_WB; virtuladdr += 0x100000; physicaladdr += 0x100000; }}
我们总共设置了三段地址映射,第一段是将物理地址0x00000000映射到虚拟地址0x00000000,因为first“应该”运行在0x00000000,所以我们将first的物理地址(0x00000000)映射到虚拟地址0x00000000处,假如first实际 的地址不在0x00000000处,那么就要将它的实际地址映射到虚拟0x00000000处,保证让cpu认为他是在0x00000000处;第二段是映射GPF的寄存器地址,我们知道要使led闪烁需要操作它的寄存器来设置它的输出值,只就需要知道寄存器的具体地址(物理地址),当我们把它们映射到虚拟地址时,我们只需要操作虚拟地址就可以访问到他们,GPFCON的物理地址是0x56000050,GPFDAT的物理地址是0x56000054,将他们映射到0xA0000050和0xA0000054上;第三段是将SDRAM的地址映射到0xB0000000上,这样我们的second段就在0xB0004000地址上了。
设置完映射表以后就有启动MMU啦,贴上代码:
void mmu_init(void){ unsigned long ttb = 0x30000000;// ARM体系架构与编程// 嵌入汇编:LINUX内核完全注释__asm__( "mov r0, #0\n" "mcr p15, 0, r0, c7, c7, 0\n" /* 使无效ICaches和DCaches */ "mcr p15, 0, r0, c7, c10, 4\n" /* drain write buffer on v4 */ "mcr p15, 0, r0, c8, c7, 0\n" /* 使无效指令、数据TLB */ "mov r4, %0\n" /* r4 = 页表基址 */ "mcr p15, 0, r4, c2, c0, 0\n" /* 设置页表基址寄存器 */ "mvn r0, #0\n" "mcr p15, 0, r0, c3, c0, 0\n" /* 域访问控制寄存器设为0xFFFFFFFF, * 不进行权限检查 */ /* * 对于控制寄存器,先读出其值,在这基础上修改感兴趣的位, * 然后再写入 */ "mrc p15, 0, r0, c1, c0, 0\n" /* 读出控制寄存器的值 */ /* 控制寄存器的低16位含义为:.RVI ..RS B... .CAM * R : 表示换出Cache中的条目时使用的算法, * 0 = Random replacement;1 = Round robin replacement * V : 表示异常向量表所在的位置, * 0 = Low addresses = 0x00000000;1 = High addresses = 0xFFFF0000 * I : 0 = 关闭ICaches;1 = 开启ICaches * R、S : 用来与页表中的描述符一起确定内存的访问权限 * B : 0 = CPU为小字节序;1 = CPU为大字节序 * C : 0 = 关闭DCaches;1 = 开启DCaches * A : 0 = 数据访问时不进行地址对齐检查;1 = 数据访问时进行地址对齐检查 * M : 0 = 关闭MMU;1 = 开启MMU */ /* * 先清除不需要的位,往下若需要则重新设置它们 */ /* .RVI ..RS B... .CAM */ "bic r0, r0, #0x3000\n" /* ..11 .... .... .... 清除V、I位 */ "bic r0, r0, #0x0300\n" /* .... ..11 .... .... 清除R、S位 */ "bic r0, r0, #0x0087\n" /* .... .... 1... .111 清除B/C/A/M */ /* * 设置需要的位 */ "orr r0, r0, #0x0002\n" /* .... .... .... ..1. 开启对齐检查 */ "orr r0, r0, #0x0004\n" /* .... .... .... .1.. 开启DCaches */ "orr r0, r0, #0x1000\n" /* ...1 .... .... .... 开启ICaches */ "orr r0, r0, #0x0001\n" /* .... .... .... ...1 使能MMU */ "mcr p15, 0, r0, c1, c0, 0\n" /* 将修改的值写入控制寄存器 */ : /* 无输出 */ : "r" (ttb) );}
注意程序开始有一句话:
unsigned long ttb = 0x30000000;
这句话是存储我们映射表的地址,在之后的操作中会告诉MMU。其他的指令可以查看相关资料,推荐《ARM体系架构与编程》。
初始化完MMU以后,把sp指针指向0xB4000000,此时这个地址就是虚拟地址了,它指向虚拟内存的顶部,pc指针指向0xB0004000,这是我们存放leds.o的地方,也就是跳向了main函数。
完成以后系统就会执行leds.c中的内容,操作led灯,我们发现使用虚拟内存后灯闪烁的更快了,那是应为MMU有DCACH和ICACH功能,加快程序的运行
- 嵌入式Linux--内存管理单元MMU
- 嵌入式linux学习笔记 – 内存管理单元mmu
- 嵌入式 linux 第四课 内存管理单元MMU
- 内存管理单元 MMU
- 内存管理单元mmu
- 内存管理单元mmu
- 内存管理单元MMU
- 内存管理单元MMU
- 内存管理单元mmu
- 内存管理单元--MMU
- 内存管理单元mmu
- 内存管理单元--MMU
- 内存管理单元-MMU
- MMU内存管理单元
- MMU内存管理单元
- 内存管理单元MMU
- 内存管理单元-MMU
- mmu内存管理单元
- Spring Cloud构建微服务架构(三)消息总线
- 同步EventBus真的需要在每个注册监听方法中处理使用try/catch吗
- 质数——python代码赏析
- strlen的三种实现方式
- HTML入门笔记26-HTML中文本输入框和单选按钮
- 嵌入式Linux--内存管理单元MMU
- 如何在IDEA启动多个Spring Boot工程实例
- MQTT的学习之Mosquitto简要教程(安装&使用)
- information_schema.referential_constraints 学习
- ERDAS2014的安装
- HDU 4027 Can you answer these queries?
- 一些记录
- request,session,application,三者比较
- 剑指offer之二维数组中的查找