linux 内核分析（转）

来源：互联网发布：黑马程序员视频编辑：程序博客网时间：2024/05/16 05:43

linux内核下载地址： http://www.kernel.org/pub/linux/kernel/

或者： http://www.kernel.org/

我们还是从顶层makefile来进行分析：
首先我们来简述一下makefile的功能，以便对makefile有更深入的理解，makefile有3点比较重要的作用：

一是决定编译哪些文件，

二是怎样编译这些文件，

三是怎样连接这些文件，最重要的是它们的顺序如何！

我们总结一下linux内核makefile文件分类

名称描述顶层Makefile它是所有Makefile文件的核心，从总体上控制着内核的编译、连接 .config配置文件，在配置内核是生成。所有makefile文件（包括顶层目录及各级子目录）都是根据.config来决定使用哪些文件 arch/$(ARCH)/Makefile 对应体系结构的makefile，它用来决定哪些体系结构相关的文件参与内核的生成，并提供一些规则来生成特定格式的内核映像 scripts/Makefile.* makefile共用的通用规则、脚本等 kbuild Makefile 各级子目录下的makefile，它们相对简单，被上一层makefile调用来编译当前目录下的文件

好，现在我们开始正式分析：

1、编译内核的命令是：make uImage，那么这个uImage的生成依赖于什么呢？我们在arch/arm/Makefile中发现了这么一句：

zImage Image xipImage bootpImage uImage: vmlinux

这说明uImag的生成依赖于vmlinux，其实vmlinux就是真正的内核，加上uImage头之后就成为了uImage。

我们知道所有要包含进内核的目录都由顶层makefile来调控，所以体系结构相关的目录（即arch/arm）肯定会被包含进顶层makefile中，果然我们在顶层makefile中发现了这么一句：

495 include $(srctree)/arch/$(ARCH)/Makefile

其中ARCH我们可以在编译时采用各种方式指定为arm，这就说明/arch/arm/Makefile被包含进了顶层Makefile中

既然vmlinux是真正的内核，那它依赖于谁呢？我们在顶层makefile文件里发现了答案：

vmlinux: $(vmlinux-lds) $(vmlinux-init) $(vmlinux-main) $(kallsyms.o) FORCE

那么vmlinux-lds、vmlinux-init、vmlinux-main和kallsyms又依赖于什么呢？顶层makefile又一次给出了答案：

606 vmlinux-init := $(head-y) $(init-y)

607 vmlinux-main := $(core-y) $(libs-y) $(drivers-y) $(net-y)

608 vmlinux-all := $(vmlinux-init) $(vmlinux-main)

609 vmlinux-lds := arch/$(ARCH)/kernel/vmlinux.lds

.......................................................................................

683 kallsyms.o := .tmp_kallsyms$(last_kallsyms).o

我们继续分析依赖关系： 606 vmlinux-init := $(head-y) $(init-y)

我们在arch/arm/makefile里找到了head-y的依赖关系：

head-y := arch/arm/kernel/head$(MMUEXT).o arch/arm/kernel/init_task

在顶层makefile里找到了init-y的依赖关系：

init-y := init/

init-y := $(patsubst %/, %/built-in.o, $(init-y))

所有init-y涉及的文件最后编译成built-in.o

对于 607 vmlinux-main := $(core-y) $(libs-y) $(drivers-y) $(net-y)我们在顶层目录找到了相应的对应关系：

core-y := usr/
core-y := $(patsubst %/, %/built-in.o, $(core-y))

core-y += kernel/ mm/ fs/ ipc/ security/ crypto/ block/

core-y := $(patsubst %/, %/built-in.o, $(core-y))

所有core-y涉及的文件最后编译成built-in.o

libs-y := lib/

libs-y := $(libs-y1) $(libs-y2)

libs-y1 := $(patsubst %/, %/lib.a, $(libs-y))

libs-y2 := $(patsubst %/, %/built-in.o, $(libs-y))

所有libs-y涉及的文件最后编译成built-in.o

drivers-y := drivers/ sound/

drivers-y := $(patsubst %/, %/built-in.o, $(drivers-y))

所有drivers-y涉及的文件最后编译成built-in.o

net-y := net/

net-y := $(patsubst %/, %/built-in.o, $(net-y))

所有net-y涉及的文件最后编译成built-in.o

2、我们看到在上面好多文件都被编译了，那么这些编译的文件如何连接在一起？存放在那些地方呢呢？这就需要看链接脚本了：vmlinux-lds

我们来分析这一行： 609 vmlinux-lds := arch/$(ARCH)/kernel/vmlinux.lds

这一行指定了连接脚本在arch/arm/kernel/vmlinux.lds中，我们对这个脚本进行一下分析：

#ifdef CONFIG_XIP_KERNEL

. = XIP_VIRT_ADDR(CONFIG_XIP_PHYS_ADDR);//代码段起始地址，这是个虚拟地址

#else

. = PAGE_OFFSET + TEXT_OFFSET;//代码段起始地址，这是个虚拟地址

#endif

.text.head : {

_stext = .;

_sinittext = .;

*(.text.head)

}

.init :{ /*内核初始化代码和数据*/

................................................

}

.text : { /*真正的代码段*/

_text = .; /*代码段和只读数据的开始*/

................................................

_etext = .; /* End of text and rodata section */

}

.data : AT(__data_loc) {

__data_start = .;/* 数据段起始地址 */

...................................

....................................

_edata = .; /*数据段结束地址*/

}

.bss : {

__bss_start = .;/* BSS段，没有初始化或初始值为0的全局、静态变量*/

*(.bss)

*(COMMON)

_end = .; /*BBS段结束地址*/

}

.stab 0 : { *(.stab) } /*调试信息段*/

.....................................................

}

分析了连接文件我们就清楚了编译出来的代码具体会放在内存的什么地方

3、这样分析似乎还是没有形成一个整体上的概念，不过没关系，我们继续：

我们知道在配置完成内核之后，会生成.config文件，makefile就是根据.config来选择不同的目录来编译内核，在顶层makefile文件里我们看到：

# Read in config

-include include/config/auto.conf

这就说明makefile是根据include/config/auto.conf文件来编译的，其实auto.conf就是根据.confog生成的文件，它去掉了.config的注释并加入一些新的配置信息，在这里我们直接用.config来分析一下：

比如在.config中有这么一行：

CONFIG_CPU_S3C2410=y

这两行就决定了makefile文件中的一些编译规则，我们知道落实到具体的编译要到底层makefile，所以我们来到了：arch/arm/mach-s3c2410/Makefile中，并找到了下面一句话：obj-$(CONFIG_CPU_S3C2410)+= s3c2410.o

我们进行一下代换就是：obj-y+= s3c2410.o。说明s3c2410.cs3c2410.S要被编译成.o文件，再结合上面我们知道，接着会被加入到built-in.o文件中，最后被编译进内核。

到目前为止只是说明了哪些文件将被编译，以及使编译进内核还是编译成模块，那么具体的编译选项如何去规定呢？我们有如下规则：
.顶层makefile和arch/$(ARCH)/Makefile设置了可以影响所有文件的编译、连接选项的项：CFLAGS(c)、AFLAGS(汇编)、LDFLAGS（连接文件）、ARFLAGS（制作库文件）。

.各级子目录下的makefile中可以设置能够影响当前目录下所有文件编译、连接选项：EXTRA_CFLAGS、EXTRA_AFLAGS、EXTRA_LDFLAGS、EXTRA_ARFLAGS；还可以设置影响某个文件的编译选项：CFLAGS_$@,AFLAGS_$@。

我们透过例子来说：

比如在driver/scsi/Makefile中有下面一行：CFLAGS_aha152x.o = -DAHA152X_STAT -DAUTOCONF

这就说明说有目录下的aha152x.c文件以规则DAHA152X_STAT -DAUTOCONF来编译

如此以来我们就大致形成了一个有条理的整体概念了，我们来总结一下：

（1）配置文件.config中定义了一系列的变量，makefile将会结合他们来决定哪些文件被编译进内核、哪些文件被编译成模块、涉及哪些子目录。

（2）顶层makefile和arch/$(ARCH)/Makefile决定根目录下哪些子目录、arch/$(ARCH)目录下哪些文件和目录将被编译进内核。

（3）最后，各级子目录下的makefile决定所在目录下哪些文件将被编译进内核，哪些文件将被编译成模块（即驱动程序），进入哪些子目录继续调用它们的makefile

（4）顶层makefile和arch/$(ARCH)/Makefile设置了可以影响所有文件的编译、连接选项的项：CFLAGS、AFLAGS、LDFLAGS、ARFLAGS。

（5）各级子目录下的makefile中可以设置能够影响当前目录下所有文件编译、连接选项：EXTRA_CFLAGS、EXTRA_AFLAGS、EXTRA_LDFLAGS、EXTRA_ARFLAGS；还可以设置影响某个文件的编译选项：CFLAGS_$@,AFLAGS_$@。

（6）顶层makefile按照一定的顺序组织文件，根据连接脚本arch/$(ARCH)/kernel/vmlinux.lds生成内核映像文件vmlinux。

4、上面是分析了uImage的编译连接规则，那么linux内核具体怎么来启动呢？我们继续分析。还记得顶层makefile里的一些东东吗？请看：

606 vmlinux-init := $(head-y) $(init-y)

607 vmlinux-main := $(core-y) $(libs-y) $(drivers-y) $(net-y)

608 vmlinux-all := $(vmlinux-init) $(vmlinux-main)

609 vmlinux-lds := arch/$(ARCH)/kernel/vmlinux.lds

head-y := arch/arm/kernel/head$(MMUEXT).o arch/arm/kernel/init_task

其实head.S就是linux内核启动首先要执行的文件，所以我们要首先分析这个文件，下面贴出代码：

#include <linux/linkage.h>

#include <linux/init.h>

#include <asm/assembler.h>

#include <asm/domain.h>

#include <asm/ptrace.h>

#include <asm/asm-offsets.h>

#include <asm/memory.h>

#include <asm/thread_info.h>

#include <asm/system.h>

#if (PHYS_OFFSET & 0x001fffff)

#error "PHYS_OFFSET must be at an even 2MiB boundary!"

#endif

#define KERNEL_RAM_VADDR(PAGE_OFFSET + TEXT_OFFSET)

#define KERNEL_RAM_PADDR(PHYS_OFFSET + TEXT_OFFSET)

* swapper_pg_dir is the virtual address of the initial page table.

* We place the page tables 16K below KERNEL_RAM_VADDR. Therefore, we must

* make sure that KERNEL_RAM_VADDR is correctly set. Currently, we expect

* the least significant 16 bits to be 0x8000, but we could probably

* relax this restriction to KERNEL_RAM_VADDR >= PAGE_OFFSET + 0x4000.

#if (KERNEL_RAM_VADDR & 0xffff) != 0x8000 /*内核地址必须是32字节对齐*/

#error KERNEL_RAM_VADDR must start at 0xXXXX8000

#endif

.globlswapper_pg_dir @定义一个全局变量

.equswapper_pg_dir, KERNEL_RAM_VADDR - 0x4000 @页表的起始地址

.macropgtbl, rd @宏定义，建立页表时有用

ldr\rd, =(KERNEL_RAM_PADDR - 0x4000)

.endm

#ifdef CONFIG_XIP_KERNEL

#define KERNEL_STARTXIP_VIRT_ADDR(CONFIG_XIP_PHYS_ADDR)

#define KERNEL_END_edata_loc

#else

#define KERNEL_STARTKERNEL_RAM_VADDR

#define KERNEL_END_end @内核镜像结束地址（虚拟地址，在vmlinux.lds.S中定义）

#endif

* Kernel startup entry point.

* ---------------------------

* This is normally called from the decompressor code. The requirements

* are: MMU = off, D-cache = off, I-cache = dont care, r0 = 0,

* r1 = machine nr.这里告诉你了机器码在r1里面

* This code is mostly position independent, so if you link the kernel at

* 0xc0008000, you call this at __pa(0xc0008000).

* See linux/arch/arm/tools/mach-types for the complete list of machine

* numbers for r1.

* We're trying to keep crap to a minimum; DO NOT add any machine specific

* crap here - that's what the boot loader (or in extreme, well justified

* circumstances, zImage) is for.

.section ".text.head", "ax" @定义一个.text.head段，段的属性a是允许段，x可执行v

.typestext, %function

ENTRY(stext) /*入口点*/

msrcpsr_c, #PSR_F_BIT | PSR_I_BIT | SVC_MODE @ ensure svc mode and irqs disabled

mrcp15, 0, r9, c0, c0@ 通过协处理器CP15的寄存器c0来get processor id

bl__lookup_processor_type@ r5=procinfo r9=cpuid，判断内核是否支持处理器CPU

movsr10, r5@ invalid processor (r5=0)?

beq__error_p@ yes, error 'p'

bl__lookup_machine_type@ r5=machinfo，通过机器码判断是否支持该单板，还记得吗？我们在u-boot里面提到过机器码。关于这个 @函数请看注释1

movsr8, r5@ invalid machine (r5=0)?

beq__error_a@ yes, error 'a'

bl__create_page_tables//创建页表，注释2里有稍微详细一点的解释，更详细的解释在MMU分析里来说

* The following calls CPU specific code in a position independent

* manner. See arch/arm/mm/proc-*.S for details. r10 = base of

* xxx_proc_info structure selected by __lookup_machine_type

* above. On return, the CPU will be ready for the MMU to be

* turned on, and r0 will hold the CPU control register value.

ldrr13, __switch_data@ address to jump to after mmu has been enabled，当mmu使能后将调到这个地址去，详见注释3

adrlr, __enable_mmu@ return (PIC) address

addpc, r10, #PROCINFO_INITFUNC

#if defined(CONFIG_SMP)

.type secondary_startup, #function

ENTRY(secondary_startup)

* Common entry point for secondary CPUs.

* Ensure that we're in SVC mode, and IRQs are disabled. Lookup

* the processor type - there is no need to check the machine type

* as it has already been validated by the primary processor.

msrcpsr_c, #PSR_F_BIT | PSR_I_BIT | SVC_MODE

mrcp15, 0, r9, c0, c0@ get processor id

bl__lookup_processor_type

movsr10, r5@ invalid processor?

moveqr0, #'p'@ yes, error 'p'

beq__error

* Use the page tables supplied from __cpu_up.

adrr4, __secondary_data

ldmiar4, {r5, r7, r13}@ address to jump to after

subr4, r4, r5@ mmu has been enabled

ldrr4, [r7, r4]@ get secondary_data.pgdir

adrlr, __enable_mmu@ return address

addpc, r10, #PROCINFO_INITFUNC@ initialise processor

@ (return control reg)

* r6 = &secondary_data

ENTRY(__secondary_switched)

ldrsp, [r7, #4]@ get secondary_data.stack

movfp, #0

bsecondary_start_kernel

.type__secondary_data, %object

__secondary_data:

.long.

.longsecondary_data

.long__secondary_switched

#endif /* defined(CONFIG_SMP) */

* Setup common bits before finally enabling the MMU. Essentially

* this is just loading the page table pointer and domain access

* registers.

.type__enable_mmu, %function

__enable_mmu:

#ifdef CONFIG_ALIGNMENT_TRAP

orrr0, r0, #CR_A

#else

bicr0, r0, #CR_A

#endif

#ifdef CONFIG_CPU_DCACHE_DISABLE

bicr0, r0, #CR_C

#endif

#ifdef CONFIG_CPU_BPREDICT_DISABLE

bicr0, r0, #CR_Z

#endif

#ifdef CONFIG_CPU_ICACHE_DISABLE

bicr0, r0, #CR_I

#endif

movr5, #(domain_val(DOMAIN_USER, DOMAIN_MANAGER) | \

domain_val(DOMAIN_KERNEL, DOMAIN_MANAGER) | \

domain_val(DOMAIN_TABLE, DOMAIN_MANAGER) | \

domain_val(DOMAIN_IO, DOMAIN_CLIENT))

mcrp15, 0, r5, c3, c0, 0@ load domain access register

mcrp15, 0, r4, c2, c0, 0@ load page table pointer

b__turn_mmu_on

* Enable the MMU. This completely changes the structure of the visible

* memory space. You will not be able to trace execution through this.

* If you have an enquiry about this, *please* check the linux-arm-kernel

* mailing list archives BEFORE sending another post to the list.

* r0 = cp#15 control register

* r13 = *virtual* address to jump to upon completion

* other registers depend on the function called upon completion

.align5

.type__turn_mmu_on, %function

__turn_mmu_on:

movr0, r0

mcrp15, 0, r0, c1, c0, 0@ write control reg

mrcp15, 0, r3, c0, c0, 0@ read id reg

movr3, r3

movpc, r13

* Setup the initial page tables. We only setup the barest

* amount which are required to get the kernel running, which

* generally means mapping in the kernel code.

* r8 = machinfo

* r9 = cpuid

* r10 = procinfo

* Returns:

* r0, r3, r6, r7 corrupted

* r4 = physical page table address

.type__create_page_tables, %function

__create_page_tables:

pgtblr4@ page table address

* Clear the 16K level 1 swapper page table

movr0, r4

movr3, #0

addr6, r0, #0x4000

1: strr3, [r0], #4

strr3, [r0], #4

teqr0, r6

bne1b

ldrr7, [r10, #PROCINFO_MM_MMUFLAGS] @ mm_mmuflags

* Create identity mapping for first MB of kernel to

* cater for the MMU enable. This identity mapping

* will be removed by paging_init(). We use our current program

* counter to determine corresponding section base address.

movr6, pc, lsr #20@ start of kernel section

orrr3, r7, r6, lsl #20@ flags + kernel base

strr3, [r4, r6, lsl #2]@ identity mapping

* Now setup the pagetables for our kernel direct

* mapped region.

addr0, r4, #(KERNEL_START & 0xff000000) >> 18

strr3, [r0, #(KERNEL_START & 0x00f00000) >> 18]!

ldrr6, =(KERNEL_END - 1)

addr0, r0, #4

addr6, r4, r6, lsr #18

1: cmpr0, r6

addr3, r3, #1 << 20

strlsr3, [r0], #4

bls1b

#ifdef CONFIG_XIP_KERNEL

* Map some ram to cover our .data and .bss areas.

orrr3, r7, #(KERNEL_RAM_PADDR & 0xff000000)

.if(KERNEL_RAM_PADDR & 0x00f00000)

orrr3, r3, #(KERNEL_RAM_PADDR & 0x00f00000)

.endif

addr0, r4, #(KERNEL_RAM_VADDR & 0xff000000) >> 18

strr3, [r0, #(KERNEL_RAM_VADDR & 0x00f00000) >> 18]!

ldrr6, =(_end - 1)

addr0, r0, #4

addr6, r4, r6, lsr #18

1: cmpr0, r6

addr3, r3, #1 << 20

strlsr3, [r0], #4

bls1b

#endif

* Then map first 1MB of ram in case it contains our boot params.

addr0, r4, #PAGE_OFFSET >> 18

orrr6, r7, #(PHYS_OFFSET & 0xff000000)

.if(PHYS_OFFSET & 0x00f00000)

orrr6, r6, #(PHYS_OFFSET & 0x00f00000)

.endif

strr6, [r0]

#ifdef CONFIG_DEBUG_LL

ldrr7, [r10, #PROCINFO_IO_MMUFLAGS] @ io_mmuflags

* Map in IO space for serial debugging.

* This allows debug messages to be output

* via a serial console before paging_init.

ldrr3, [r8, #MACHINFO_PGOFFIO]

addr0, r4, r3

rsbr3, r3, #0x4000@ PTRS_PER_PGD*sizeof(long)

cmpr3, #0x0800@ limit to 512MB

movhir3, #0x0800

addr6, r0, r3

ldrr3, [r8, #MACHINFO_PHYSIO]

orrr3, r3, r7

1: strr3, [r0], #4

addr3, r3, #1 << 20

teqr0, r6

bne1b

#if defined(CONFIG_ARCH_NETWINDER) || defined(CONFIG_ARCH_CATS)

* If we're using the NetWinder or CATS, we also need to map

* in the 16550-type serial port for the debug messages

addr0, r4, #0xff000000 >> 18

orrr3, r7, #0x7c000000

strr3, [r0]

#endif

#ifdef CONFIG_ARCH_RPC

* Map in screen at 0x02000000 & SCREEN2_BASE

* Similar reasons here - for debug. This is

* only for Acorn RiscPC architectures.

addr0, r4, #0x02000000 >> 18

orrr3, r7, #0x02000000

strr3, [r0]

addr0, r4, #0xd8000000 >> 18

strr3, [r0]

#endif

movpc, lr

.ltorg

#include "head-common.S"

注释1：这个注释比较长，要静下心来看

3: .long.

.long__arch_info_begin

.long__arch_info_end

..........................................................................................

__lookup_machine_type:

adrr3, 3b @r3存放这标号3处的物理地址

ldmiar3, {r4, r5, r6} @r4存放标号3处的虚拟地址，r5=__arch_info_begin的虚拟地址,r6=long__arch_info_end的虚拟地址

subr3, r3, r4@ r3=物理地址与虚拟地址间的偏移量

addr5, r5, r3@ r5=__arch_info_begin的物理地址

addr6, r6, r3@ r6=__arch_info_end的物理地址

1: ldrr3, [r5, #MACHINFO_TYPE]@ 获取机器码

teqr3, r1@ 比较

beq2f@ 匹配了就返回，好的那么我们就返回head.S了，拜拜！！！

addr5, r5, #SIZEOF_MACHINE_DESC@ next machine_desc

cmpr5, r6 //判断是不是到了最后一个machine_desc

blo1b //不是就跳回标号1

movr5, #0@ unknown machine

2: movpc, lr

上面为什么要经虚拟地址改变成物理地址呢？这是因为MMU还没有启动，不能使用虚拟地址！关于MMU的问题我们还会再分析。

上面提到了：

__arch_info_begin

__arch_info_end

这是什么东西呢？我们在连接文件arch/arm/kernel/vmlinux.lds中发现了它的源头：

__arch_info_begin = .;

*(.arch.info.init)

__arch_info_end = .;

我们看到在__arch_info_begin与__arch_info_end之间存放的是*(.arch.info.init)，那么*(.arch.info.init)又是什么东西呢？我们收索内核文件，最后在include/asm-arm/mach中发现了arch.info.init的蛛丝马迹：

#define MACHINE_START(_type,_name)\

static const struct machine_desc __mach_desc_##_type\

__used \

__attribute__((__section__(".arch.info.init"))) = {\

.nr= MACH_TYPE_##_type,\

.name= _name,

#define MACHINE_END\

};

原来.arch.info.init和其它信息一起被定义在了一个宏MACHINE_START里面，那么是谁在使用这个宏呢？我们收索内核文件，发现在arch/arm/mach-s3c2410/mach-smdk2410.c里使用了这个宏，我们还是贴出相关代码：

MACHINE_START(SMDK2410, "SMDK2410")

.phys_io= S3C2410_PA_UART,

.io_pg_offst= (((u32)S3C24XX_VA_UART) >> 18) & 0xfffc,

.boot_params= S3C2410_SDRAM_PA + 0x100,

.map_io= smdk2410_map_io,

.init_irq= s3c24xx_init_irq,

.init_machine= smdk2410_init,

.timer= &s3c24xx_timer,

MACHINE_END

我们将宏展开，得到：

static const struct machine_desc __mach_desc_SMDK2410

__used

__attribute__((__section__(".arch.info.init"))) = {

.nr= MACH_TYPE_SMDK2410 ,

.name= "SMDK2410" ,

. phys_io= S3C2410_PA_UART,

.io_pg_offst= (((u32)S3C24XX_VA_UART) >> 18) & 0xfffc,

.boot_params= S3C2410_SDRAM_PA + 0x100,

.map_io= smdk2410_map_io,

.init_irq= s3c24xx_init_irq,

.init_machine= smdk2410_init,

.timer= &s3c24xx_timer,

};

那好现在我们的任务就是来分析上面这段代码，这段代码不就是定义了一个struct machine_desc结构体吗，我们找到这个结构体的定义：

struct machine_desc {

unsigned intnr;/* architecture number，这个就是机器码了*/

unsigned intphys_io;/* start of physical io*/

unsigned intio_pg_offst;/* byte offset for io

* page tabe entry*/

const char*name;/* architecture name，体系结构名字*/

unsigned longboot_params;/* tagged list*/

unsigned intvideo_start;/* start of video RAM*/

unsigned intvideo_end;/* end of video RAM*/

unsigned intreserve_lp0 :1;/* never has lp0*/

unsigned intreserve_lp1 :1;/* never has lp1*/

unsigned intreserve_lp2 :1;/* never has lp2*/

unsigned intsoft_reboot :1;/* soft reboot*/

void(*fixup)(struct machine_desc *,

struct tag *, char **,

struct meminfo *);

void(*map_io)(void);/* IO mapping function*/

void(*init_irq)(void);

struct sys_timer*timer;/* system tick timer*/

void(*init_machine)(void);

};

一个linux内核会在它所支持的单板所对应的单板文件里定义一个struct machine_desc 结构体，当然是用宏定义的，不信的话可以查一下其它的单板文件。在这个结构体里就会对机器码赋值，比如上面例子里nr= MACH_TYPE_SMDK2410，那么这个 MACH_TYPE_SMDK2410到底是多少呢？这在arch/arm/tools/mach-types里有定义，比如：

smdk2410 ARCH_SMDK2410SMDK2410193

这些机器码的值就和u-boot里面传进来的参数（机器码）相对应，u-boot传进来的机器码放在了r1寄存器里。

而 __attribute__((__section__(".arch.info.init"))) 就是对这个结构体定义了一个属性，将它的段强制转化为.arch.info.init，这样就可以放在__arch_info_begin与__arch_info_end之间了。

现在我们就很清楚__lookup_machine_type要做的事情了，就是从__arch_info_begin与__arch_info_end之间取出struct machine_desc结构体，并将其机器码与r1寄存器值（就是u-boot传进来的机器码）相比较，如果机器码相同的话，就说明内核支持相应的单板，如果不相同就取下一个struct machine_desc结构体，如果比较完还没有发现匹配项，就说明内核不支持相应的单板，出错返回。

好的，现在可以回去了！回哪儿去？呵呵，别忘了我们的任务是分析head.S，这里只是head.S中的一小段代码，任重道远呢！

注释2：问什么要创建页表呢？

我们知道在连接脚本arch/arm/kernel/vmlinux.lds.S中定义了内核的连接地址是：. = XIP_VIRT_ADDR(CONFIG_XIP_PHYS_ADDR)或者

. = PAGE_OFFSET + TEXT_OFFSET这是虚拟地址，并不对应真正的内存地址。真正的内存地址是从0x30000000开始的，因此要创建页表，来进行虚拟地址与物理地址的映射。

注释3：MMU启动后跳转到哪里呢？

MMU启动之后会根据地址__switch_data跳转到arch/arm/kernel中__switch_data标号处。然后进行了没几步就通过

b start_kernel

跳转到start_kernel开始执行。我们找到这个函数，发现是个c函数，有点兴奋！

关于start_kernel的代码我们就不全部贴出来了，只是做一些必要的分析，先简述一下它的功能：

printk(linux_banner);输出内核版本信息

setup_arch(&command_line);设置与体系结构相关的环境，下面将着重分析

setup_command_line(command_line);

console_init();初始化控制台

rest_init();启动init进程，下面还会分析

我们着重分析一下setup_arch(&command_line)和setup_command_line(command_line)：

还记不记得u-boot启动内核的命令：theKernel (0, bd->bi_arch_number, bd->bi_boot_params)

这里面有两个参数 bd->bi_arch_number和bd->bi_boot_params，前者代表机器码，我们在前面已经对它进行了处理，后者是其它一些参数，我们还没有处理，其实setup_arch(&command_line)和setup_command_line(command_line)就是来处理这些参数的，我们现在来分析一下：

先贴出setup_arch的代码

void __init setup_arch(char **cmdline_p)

{

struct tag *tags = (struct tag *)&init_tags;

struct machine_desc *mdesc; //详见注释1

char *from = default_command_line;//内核启动时没有传入命令行参数的话会采用默认的命令行参数

setup_processor();

mdesc = setup_machine(machine_arch_type);

machine_name = mdesc->name;//单板的名字

if (mdesc->soft_reboot)

reboot_setup("s");

if (mdesc->boot_params)

tags = phys_to_virt(mdesc->boot_params);

* If we have the old style parameters, convert them to

* a tag list.

if (tags->hdr.tag != ATAG_CORE)

convert_to_tag_list(tags);

if (tags->hdr.tag != ATAG_CORE)

tags = (struct tag *)&init_tags;

if (mdesc->fixup)

mdesc->fixup(mdesc, tags, &from, &meminfo);

if (tags->hdr.tag == ATAG_CORE) {

if (meminfo.nr_banks != 0)

squash_mem_tags(tags);

parse_tags(tags);

}

init_mm.start_code = (unsigned long) &_text;

init_mm.end_code = (unsigned long) &_etext;

init_mm.end_data = (unsigned long) &_edata;

init_mm.brk = (unsigned long) &_end;

memcpy(boot_command_line, from, COMMAND_LINE_SIZE);

boot_command_line[COMMAND_LINE_SIZE-1] = '\0';

parse_cmdline(cmdline_p, from);//解析命令行参数

paging_init(&meminfo, mdesc);

request_standard_resources(&meminfo, mdesc);

#ifdef CONFIG_SMP

smp_init_cpus();

#endif

cpu_init();

* Set up various architecture-specific pointers

init_arch_irq = mdesc->init_irq;

system_timer = mdesc->timer;

init_machine = mdesc->init_machine;

#ifdef CONFIG_VT

#if defined(CONFIG_VGA_CONSOLE)

conswitchp = &vga_con;

#elif defined(CONFIG_DUMMY_CONSOLE)

conswitchp = &dummy_con;

#endif

}

注释1：

这个结构体没忘记吧，由u-boot传进来的机器码就可以找到相对应的结构体。还记的我们上面分析的东西吗？这行代码还记不记的：.boot_params= S3C2410_SDRAM_PA + 0x100,其中S3C2410_SDRAM_PA=0x30000000，那么boot_params=0x30000100，再想想我们在u-boot分析里分析出来的启动参数放在哪里！想起来了吧，就是放在0x30000100地址开始处。这样就找到了u-boot传进来的参数，接下来就是对其进行处理

再来贴出的代码：

static void __init setup_command_line(char *command_line)

{

saved_command_line = alloc_bootmem(strlen (boot_command_line)+1);

static_command_line = alloc_bootmem(strlen (command_line)+1);

strcpy (saved_command_line, boot_command_line);

strcpy (static_command_line, command_line);

}

这个函数很简单，只是将相应的启动参数保存

我们再来分析一下rest_init()

首先要明确一下，u-boot的最终目的是为了启动内核，那么内核启动的目的又是什么呢？那就是运行应用程序，而应用程序是挂载在跟文件系统上的。其实rest_init()就是来启动应用程序的，好的，来看代码：

rest_init()里面调用kernel_thread(kernel_init, NULL, CLONE_FS | CLONE_SIGHAND)，而这个函数的含义可以理解为调用函数kernel_init()----->prepare_namespace()------>mount_root()，这个函数就用来挂接跟文件系统。挂载好跟文件系统后会回到kernel_init()函数里调用函数：init_post()，在init_post()函数里我们贴出一些代码来说明它的作用：
sys_open((const char __user *) "/dev/console", O_RDWR, 0) //打开控制台

run_init_process("/sbin/init");//执行应用程序

run_init_process("/etc/init");

run_init_process("/bin/init");

run_init_process("/bin/sh");

上面prepare_namespace()调用mount_root()来挂载跟文件系统，其实在挂载文件系统之前肯定还要根据具体的参数来确定挂载哪些文件系统，所以我们还是要在来分析一下prepare_namespace()函数：

我们贴出init/do_mounts.c文件里的下面几行代码

static int __init root_dev_setup(char *line)

{

strlcpy(saved_root_name, line, sizeof(saved_root_name));

return 1;

}

__setup("root=", root_dev_setup);

__setup的定义在include/linux/init.h中：

#define __setup(str, fn)

__setup_param(str, fn, fn, 0)

#define __setup_param(str, unique_id, fn, early)

static char __setup_str_##unique_id[] __initdata = str;

static struct obs_kernel_param __setup_##unique_id

__attribute_used__

__attribute__((__section__(".init.setup")))

__attribute__((aligned((sizeof(long)))))

= { __setup_str_##unique_id, fn, early }

以上就是定义了一个结构体，这个结构体里有一个字符串，一个函数，还有一个early，且这个结构体的段属性为.init.setup，查看连接脚本发现如下代码：

__setup_start = .;

*(.init.setup)

__setup_end = .;

说明所有的结构体被放在__setup_start 到__setup_end 之间。其实在解析命令行参数是，就会根据root=？来调用相应的处理程序！

好的，就分析到这里了，最后一点分析的比较酱油，今后估计在移植的时候会进一步分析

0 0