Oranges 读书笔记之加载内核

来源：互联网发布：数据库的审计类型有编辑：程序博客网时间：2024/05/20 13:16

接我的上一篇博客

当成功跳转到loader时，所有的指挥权就都在loader手中，因为上文boot.bin中我们只实现了寻找，加载并跳入loader,而在操作系统内核执行之前的加载内核，跳入保护模式等步骤都没有完成。可想而知，这些任务都要交给Loader来完成。

一.加载内核

1.认识内核格式elf

elf文件由4个部分组成，分别是ELF header,Program header table,Sections和Section header table，其中只有ELF头的位置是固定的。

ELF的格式大致如下：

而ELF头格式如代码所示：

#define EI_NIDENT 16

typedef struct{ //大小

unsigned char e_ident[EI_NIDENT]; //16 包含用以表示ELF文件的字符及其他

Elf32_Half e_type; //2 文件类型（可执行文件为2）

Elf32_Half e_machine; //2 该程序的体系结构

Elf32_word e_version; //4 文件版本

Elf32_Addr e_entry; //4 程序入口地址

Elf32_Off e_phoff; //4 Program header table在文件的偏移

Elf32_Off e_shoff; // Section header table的偏移

Elf32_word e_flags; // 为0

Elf32_Half e_ehsize; // Elf header大小

Elf32_Half e_phentsize; // Program header table每个条目大小

Elf32_Half e_phnum; // Program header table的条目数

Elf32_Half e_shentsize; // Section header table条目大小

Elf32_Half e_shnum; // Section header table的条目数

Elf32_Half e _shstrndx; // 包含节名称的字符串表是第几个节

}Elf32_Ehdr;

为了完成加载并跳入内核，我们暂时只需要知道以上的e_entry,e_phoff，e_ehsize,e_phentsize,e_phnum

以及Program header 的结构

typedef struct{

Elf32_word p_type; //所描述的段的类型

Elf32_Off p_offset; //段的第一个字节在文件中的偏移

Elf32_Addr p_vaddr; //段的第一个字节在内存中的虚拟地址

Elf32_Addr p_paddr; //为物理地址保留

Elf32_word p_filesz; //段在文件中的长度

Elf32_word p_memsz; //段在内存中的长度

Elf32_word p_flags; //与段相关的标志

Elf32_word p_align; //根据此项值来确定段在文件以及内存中如何对齐

}Elf32_Phdr;

所以Program header描述了一个段的信息，我们把文件加载进内存就靠这些信息。

其他我们先不管。

假设我们已经有一个内核代码kernel.asm,我们用nasm的选项-f elf指定输出文件为elf文件格式。

nasm -f elf -o kernel.o kernel.asm

ld -s kernel.o -o kernel.bin

2.寻找并加载内核

我们把生成的内核拷贝到软盘上，然后修改loader.asm实现在软盘上寻找并加载内核到指定位置。

步骤同上文boot中寻找loader并加载。加载完成后关闭软驱马达，并显示一个字符串，具体代码如下：

org 0100hBaseOfStackequ0100hBaseOfKernelFileequ 08000h; KERNEL.BIN 被加载到的位置 ---- 段地址OffsetOfKernelFileequ 0h; KERNEL.BIN 被加载到的位置 ---- 偏移地址jmpLABEL_START; Start; 下面是 FAT12 磁盘的头, 之所以包含它是因为下面用到了磁盘的一些信息%include"fat12hdr.inc"LABEL_START:; <--- 从这里开始 *************movax, csmovds, axmoves, axmovss, axmovsp, BaseOfStackmovdh, 0; "Loading "callDispStr; 显示字符串; 下面在 A 盘的根目录寻找 KERNEL.BINmovword [wSectorNo], SectorNoOfRootDirectoryxorah, ah; `.xordl, dl; | 软驱复位int13h; /LABEL_SEARCH_IN_ROOT_DIR_BEGIN:cmpword [wRootDirSizeForLoop], 0; `.jzLABEL_NO_KERNELBIN; | 判断根目录区是不是已经读完,decword [wRootDirSizeForLoop]; / 读完表示没有找到 KERNEL.BINmovax, BaseOfKernelFilemoves, ax; es <- BaseOfKernelFilemovbx, OffsetOfKernelFile; bx <- OffsetOfKernelFilemovax, [wSectorNo]; ax <- Root Directory 中的某 Sector 号movcl, 1callReadSectormovsi, KernelFileName; ds:si -> "KERNEL BIN"movdi, OffsetOfKernelFilecldmovdx, 10hLABEL_SEARCH_FOR_KERNELBIN:cmpdx, 0 ; `.jzLABEL_GOTO_NEXT_SECTOR_IN_ROOT_DIR; | 循环次数控制, 如果已经读完decdx ; / 了一个 Sector, 就跳到下一个movcx, 11LABEL_CMP_FILENAME:cmpcx, 0; `.jzLABEL_FILENAME_FOUND; | 循环次数控制, 如果比较了 11 个字符都deccx; / 相等, 表示找到lodsb; ds:si -> alcmpal, byte [es:di]; if al == es:dijzLABEL_GO_ONjmpLABEL_DIFFERENTLABEL_GO_ON:incdijmpLABEL_CMP_FILENAME;继续循环LABEL_DIFFERENT:anddi, 0FFE0h; else`. 让 di 是 20h 的倍数adddi, 20h; |movsi, KernelFileName; | di += 20h 下一个目录条目jmpLABEL_SEARCH_FOR_KERNELBIN; /LABEL_GOTO_NEXT_SECTOR_IN_ROOT_DIR:addword [wSectorNo], 1jmpLABEL_SEARCH_IN_ROOT_DIR_BEGINLABEL_NO_KERNELBIN:movdh, 2; "No KERNEL."callDispStr; 显示字符串%ifdef_LOADER_DEBUG_movax, 4c00h; `.int21h; / 没有找到 KERNEL.BIN, 回到 DOS%elsejmp$; 没有找到 KERNEL.BIN, 死循环在这里%endifLABEL_FILENAME_FOUND:; 找到 KERNEL.BIN 后便来到这里继续movax, RootDirSectorsanddi, 0FFF0h; di -> 当前条目的开始pusheaxmoveax, [es : di + 01Ch]; `.movdword [dwKernelSize], eax; / 保存 KERNEL.BIN 文件大小popeaxadddi, 01Ah; di -> 首 Sectormovcx, word [es:di]pushcx; 保存此 Sector 在 FAT 中的序号addcx, axaddcx, DeltaSectorNo; cl <- KERNEL.BIN 的起始扇区号(0-based)movax, BaseOfKernelFilemoves, ax; es <- BaseOfKernelFilemovbx, OffsetOfKernelFile; bx <- OffsetOfKernelFilemovax, cx; ax <- Sector 号LABEL_GOON_LOADING_FILE:pushax; `.pushbx; |movah, 0Eh; | 每读一个扇区就在 "Loading " 后面moval, '.'; | 打一个点, 形成这样的效果:movbl, 0Fh; | Loading ......int10h; |popbx; |popax; /movcl, 1callReadSectorpopax; 取出此 Sector 在 FAT 中的序号callGetFATEntrycmpax, 0FFFhjzLABEL_FILE_LOADEDpushax; 保存 Sector 在 FAT 中的序号movdx, RootDirSectorsaddax, dxaddax, DeltaSectorNoaddbx, [BPB_BytsPerSec]jmpLABEL_GOON_LOADING_FILELABEL_FILE_LOADED:callKillMotor; 关闭软驱马达movdh, 1; "Ready."callDispStr; 显示字符串jmp$;============================================================================;变量;----------------------------------------------------------------------------wRootDirSizeForLoopdwRootDirSectors; Root Directory 占用的扇区数wSectorNodw0; 要读取的扇区号bOdddb0; 奇数还是偶数dwKernelSizedd0; KERNEL.BIN 文件大小;============================================================================;字符串;----------------------------------------------------------------------------KernelFileNamedb"KERNEL BIN", 0; KERNEL.BIN 之文件名; 为简化代码, 下面每个字符串的长度均为 MessageLengthMessageLengthequ9LoadMessage:db"Loading "Message1db"Ready. "Message2db"No KERNEL";============================================================================;----------------------------------------------------------------------------; 函数名: DispStr;----------------------------------------------------------------------------; 作用:;显示一个字符串, 函数开始时 dh 中应该是字符串序号(0-based)DispStr:movax, MessageLengthmuldhaddax, LoadMessagemovbp, ax; ┓movax, ds; ┣ ES:BP = 串地址moves, ax; ┛movcx, MessageLength; CX = 串长度movax, 01301h; AH = 13, AL = 01hmovbx, 0007h; 页号为0(BH = 0) 黑底白字(BL = 07h)movdl, 0adddh, 3; 从第 3 行往下显示int10h; int 10hret;----------------------------------------------------------------------------; 函数名: ReadSector;----------------------------------------------------------------------------; 作用:;从序号(Directory Entry 中的 Sector 号)为 ax 的的 Sector 开始, 将 cl 个 Sector 读入 es:bx 中ReadSector:; -----------------------------------------------------------------------; 怎样由扇区号求扇区在磁盘中的位置 (扇区号 -> 柱面号, 起始扇区, 磁头号); -----------------------------------------------------------------------; 设扇区号为 x; ┌ 柱面号 = y >> 1; x ┌ 商 y ┤; -------------- => ┤ └ 磁头号 = y & 1; 每磁道扇区数 │; └ 余 z => 起始扇区号 = z + 1pushbpmovbp, spsubesp, 2; 辟出两个字节的堆栈区域保存要读的扇区数: byte [bp-2]movbyte [bp-2], clpushbx; 保存 bxmovbl, [BPB_SecPerTrk]; bl: 除数divbl; y 在 al 中, z 在 ah 中incah; z ++movcl, ah; cl <- 起始扇区号movdh, al; dh <- yshral, 1; y >> 1 (其实是 y/BPB_NumHeads, 这里BPB_NumHeads=2)movch, al; ch <- 柱面号anddh, 1; dh & 1 = 磁头号popbx; 恢复 bx; 至此, "柱面号, 起始扇区, 磁头号" 全部得到 ^^^^^^^^^^^^^^^^^^^^^^^^movdl, [BS_DrvNum]; 驱动器号 (0 表示 A 盘).GoOnReading:movah, 2; 读moval, byte [bp-2]; 读 al 个扇区int13hjc.GoOnReading; 如果读取错误 CF 会被置为 1, 这时就不停地读, 直到正确为止addesp, 2popbpret;----------------------------------------------------------------------------; 函数名: GetFATEntry;----------------------------------------------------------------------------; 作用:;找到序号为 ax 的 Sector 在 FAT 中的条目, 结果放在 ax 中;需要注意的是, 中间需要读 FAT 的扇区到 es:bx 处, 所以函数一开始保存了 es 和 bxGetFATEntry:pushespushbxpushaxmovax, BaseOfKernelFile; ┓subax, 0100h; ┣ 在 BaseOfKernelFile 后面留出 4K 空间用于存放 FATmoves, ax; ┛popaxmovbyte [bOdd], 0movbx, 3mulbx; dx:ax = ax * 3movbx, 2divbx; dx:ax / 2 ==> ax <- 商, dx <- 余数cmpdx, 0jzLABEL_EVENmovbyte [bOdd], 1LABEL_EVEN:;偶数xordx, dx; 现在 ax 中是 FATEntry 在 FAT 中的偏移量. 下面来计算 FATEntry 在哪个扇区中(FAT占用不止一个扇区)movbx, [BPB_BytsPerSec]divbx; dx:ax / BPB_BytsPerSec ==>ax <- 商 (FATEntry 所在的扇区相对于 FAT 来说的扇区号);dx <- 余数 (FATEntry 在扇区内的偏移)。pushdxmovbx, 0; bx <- 0于是, es:bx = (BaseOfKernelFile - 100):00 = (BaseOfKernelFile - 100) * 10haddax, SectorNoOfFAT1; 此句执行之后的 ax 就是 FATEntry 所在的扇区号movcl, 2callReadSector; 读取 FATEntry 所在的扇区, 一次读两个, 避免在边界发生错误, 因为一个 FATEntry 可能跨越两个扇区popdxaddbx, dxmovax, [es:bx]cmpbyte [bOdd], 1jnzLABEL_EVEN_2shrax, 4LABEL_EVEN_2:andax, 0FFFhLABEL_GET_FAT_ENRY_OK:popbxpopesret;----------------------------------------------------------------------------;----------------------------------------------------------------------------; 函数名: KillMotor;----------------------------------------------------------------------------; 作用:;关闭软驱马达KillMotor:pushdxmovdx, 03F2hmoval, 0outdx, alpopdxret;----------------------------------------------------------------------------

二.跳入保护模式

因为一开始CPU是工作在实模式下的，在实模式下CPU为16位，有着16位的寄存器，16位的数据总线及20位的地址总线。只能寻址1MB，所以内存最大也只为1MB。从80386始，intel的CPU开始进入32位，有32位的地址线，可以寻址4GB。

在实模式下CPU寻址是通过段：偏移，段值由16位的CS，DS，SS等寄存器表示。每一个段的最大长度为64K，物理地址的计算遵循以下公式：物理地址＝段值＊10h+偏移。而保护模式下CPU寻址虽然也是段：偏移，不过此时的段已经不是实模式下的段了，尽管它的值也由段寄存器表示。此时它变成了一个索引，指向一个数据结构中的表项。这个数据结构我们称之为GDT

所以为了跳入保护模式，我们需要以下步骤：

1.准备GDT

具体见代码:

; GDT ------------------------------------------------------------------------------------------------------------------------------------------------------------; 段基址段界限 , 属性LABEL_GDT: Descriptor 0, 0, 0 ; 空描述符LABEL_DESC_FLAT_C: Descriptor 0, 0fffffh, DA_CR | DA_32 | DA_LIMIT_4K ; 0 ~ 4GLABEL_DESC_FLAT_RW: Descriptor 0, 0fffffh, DA_DRW | DA_32 | DA_LIMIT_4K ; 0 ~ 4GLABEL_DESC_VIDEO: Descriptor 0B8000h, 0ffffh, DA_DRW | DA_DPL3 ; 显存首地址; GDT ------------------------------------------------------------------------------------------------------------------------------------------------------------GdtLen equ $ - LABEL_GDTGdtPtr dw GdtLen - 1 ; 段界限 dd BaseOfLoaderPhyAddr + LABEL_GDT ; 基地址; GDT 选择子 ----------------------------------------------------------------------------------SelectorFlatC equ LABEL_DESC_FLAT_C - LABEL_GDTSelectorFlatRW equ LABEL_DESC_FLAT_RW - LABEL_GDTSelectorVideo equ LABEL_DESC_VIDEO - LABEL_GDT + SA_RPL3; GDT 选择子 ----------------------------------------------------------------------------------

初看感觉GDT是一个结构数组，数组的每一个元素就是类型为Descriptor的段，以上代码初始化了段的基址，界限及属性。

Descriptor的定义如下：

; 描述符; usage: Descriptor Base, Limit, Attr; Base: dd; Limit: dd (low 20 bits available); Attr: dw (lower 4 bits of higher byte are always 0)%macro Descriptor 3 dw %2 & 0FFFFh ; 段界限 1 (2 字节) dw %1 & 0FFFFh ; 段基址 1 (2 字节) db (%1 >> 16) & 0FFh ; 段基址 2 (1 字节) dw ((%2 >> 8) & 0F00h) | (%3 & 0F0FFh) ; 属性 1 + 段界限 2 + 属性 2 (2 字节) db (%1 >> 24) & 0FFh ; 段基址 3 (1 字节)%endmacro ; 共 8 字节

可以看出Descriptor是一个宏

代码段和数据段描述符的具体结构如下：

现在看GDT表中各描述符的属性，分别有DA_CR,DA_DRW,DA_32,DA_LIMIT_4K,DA_DPL3.

DA_CR=9Ah,存在的可执行可读代码段；DA_DRW=92h,存在的可读写数据段；DA_LIMIT_4K,段界限粒度为4k;DA_DPL3=60h,特权值为3

而GdtLen是整个GDT表的长度，GdtPtr也是一个数据结构，前2个字节为GDT长度，后4个字节为GDT表的基址。

以Selector开头的称为选择子，看上去好像是段在GDT中的索引。CPU寻址的时候就是靠这个从GDT表中得到段的信息，从而正确寻址。Selector存储在CS，DS，ES等段寄存器中，类似于实模式下的段基址。

最后通过一个命令：lgdt [GdtPtr];加载GdtPtr的值到CPU的gdtr寄存器。该寄存器的结构与GdtPtr完全相同。

2.将CPU的工作状态转换为实模式

首先关中断，因为实模式下中断处理机制和保护模式下不同，然后打开A20地址线，通过操作端口92h，最后将cr0寄存器的第零位置为1，该位为1时，cpu运行于保护模式下。

实现代码如下

; 关中断 cli ; 打开地址线A20 in al, 92h or al, 00000010b out 92h, al ; 准备切换到保护模式 mov eax, cr0 or eax, 1 mov cr0, eax

3.从实模式跳入保护模式

跳转只需要一句代码：jmp dword SelectorFlatC:(PM_START)

因为该跳转是在实模式下，而目的地址是在保护模式下，如果偏移超过64K，则可能被截断，所以在前面加dword

三.打开分页机制

分页机制就像一个函数，将物理地址映射为线性地址，那么如何映射呢？我相信看了下面的图就明白了：

在80386中每一个页的大小是4096字节，转换使用2级页表，每个表项4字节长，所以一个页表中最多有1024个表项。进行转换时，先从寄存器cr3指定的页目录中根据线性地址的高10位得到页表地址，再根据线性地址第12到21位得到物理页地址，最后根据低12位加上物理页首地址得到物理地址。

分页机制生效与否还取决于寄存器cr0的第31位称为PG位是否为1，若为1，则分页机制启动。关键代码如下：

SetupPaging: ; 为简化处理, 所有线性地址对应相等的物理地址. ; 首先初始化页目录 mov ax, SelectorPageDir ; 此段首地址为 PageDirBase mov es, ax mov ecx, 1024 ; 共 1K 个表项 xor edi, edi xor eax, eax mov eax, PageTblBase | PG_P | PG_USU | PG_RWW.1: stosd add eax, 4096 ; 为了简化, 所有页表在内存中是连续的. loop .1 ; 再初始化所有页表 (1K 个, 4M 内存空间) mov ax, SelectorPageTbl ; 此段首地址为 PageTblBase mov es, ax mov ecx, 1024 * 1024 ; 共 1M 个页表项, 也即有 1M 个页 xor edi, edi xor eax, eax mov eax, PG_P | PG_USU | PG_RWW.2: stosd add eax, 4096 ; 每一页指向 4K 的空间 loop .2 mov eax, PageDirBase mov cr3, eax mov eax, cr0 or eax, 80000000h mov cr0, eax jmp short .3.3: nop ret; 分页机制启动完毕 ----------------------------------------------------------

以上的程序实现了最简单的映射，将线性地址映射成相同的物理地址，若要映射成不同的物理地址，可以修改初始化页表时该页表指向的物理页地址。

四.重新放置内核并跳入内核

我们的内核已经被加载到内存中，但是我们并不能直接跳转到内核开始处执行，我们得重新放置我们的内核。

为了使内核放在指定的地址，在生成elf文件时就要带上参数，-s -Ttext 0x30400将程序入口地址变成30400，关键实现代码如下：; InitKernel ---------------------------------------------------------------------------------; 将 KERNEL.BIN 的内容经过整理对齐后放到新的位置; 遍历每一个 Program Header，根据 Program Header 中的信息来确定把什么放进内存，放到什么位置，以及放多少。; --------------------------------------------------------------------------------------------InitKernel: xor esi, esi mov cx, word [BaseOfKernelFilePhyAddr+2Ch];`. ecx <- pELFHdr->e_phnum movzx ecx, cx ;/ mov esi, [BaseOfKernelFilePhyAddr + 1Ch] ; esi <- pELFHdr->e_phoff add esi, BaseOfKernelFilePhyAddr;esi<-OffsetOfKernel+pELFHdr->e_phoff.Begin: mov eax, [esi + 0] cmp eax, 0 ; PT_NULL jz .NoAction push dword [esi + 010h] ;size ;`. mov eax, [esi + 04h] ; | add eax, BaseOfKernelFilePhyAddr; | memcpy((void*)(pPHdr->p_vaddr), push eax ;src ; | uchCode + pPHdr->p_offset, push dword [esi + 08h] ;dst ; | pPHdr->p_filesz; call MemCpy ; | add esp, 12 ;/.NoAction: add esi, 020h ; esi += pELFHdr->e_phentsize dec ecx jnz .Begin ret; InitKernel ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^

根据elf文件的elf头和程序头表中的信息将内核复制到指定地址，最后跳转到该地址处，内核真正开始执行。