LTORG

来源:互联网 发布:网络诈骗学生自杀 编辑:程序博客网 时间:2024/05/01 22:11

    RISC CPU是众多CPU中的一种. RISC是精简指令集的CPU. 也就是说, 它的指令系统一般都十分简洁.本文将要介绍的是RISCCPU中目前十分普遍的ARMCPU。目前很多的RISC CPU均是使用的32BIT长度的指令. 也就是每个指令长度为32BIT(注意:包括操作码和操作数一共32位). (也有很多RISC CPU提供16BIT长度的指令系统,用于缩短代码长度)
       所有的代码均长度为32BIT意味着CPUDESIGNER可以比较省力设计CPU. 而CPU DECODE代码的速度也可以相对快很多.
       INTEL系列的CPU指令长度是不固定的. 从1BYTE~15BYTE.均是允许范围之内的. 这样的话, 我们就可以看到一条JMP XXXXXXXX的指令会被编译成5个字节长度. 一条指令便解决了一条附带有32BIT操作数的操作. 但是RISC无法这样处理. 在ARM的CPU中, 所有指令均是32BIT. 这样,32BIT的操作数就无法直接处理了.

    我们举例说明.
    在INTEL 386以上的CPU上, 我们可以直接加载1个32BIT VALUE到EAX.
    MOV EAX,12345678H
    在对应的ARM CPU上,编译器提供的是对等的操作,也是MOV指令
    MOV R0,=0x12345678
    但是我们可以发现, 这样的指令是无法通过编译的. 因为MOV指令只能有8BIT的操作数,32bit的mov指令,只留了8bit的操作数,这就决定了MOV指令的操作数大小有一定的限制,那我们如何处理呢?
    OK. 现在是编译器帮忙的时候了.
    我们提供给编译器一条指令
    LDR R0,=0X12345678
    编译器就必须识别=0X12345678是否可以被精简到8BIT. 显然不行! 编译器接下来的方案就是要把32BIT的常量, 放置到内存的某个地址, 让寻址指令来处理。现在编译器将尝试将0X12345678放置到CODE SECTOIN的尾部.然后通过一条 LDR R0,(某地址)的指令来解决.这就是一般的解决之道.
    
但是我们必须再度想一下,LDR指令能寻址多远呢? LDR伪指令最多处理4K的偏移!!! 也是因为CPU指令集的问题.我们的CODE SECTION如果很大,导致0X12345678放置的地方超过了LDR伪指令寻址能力,将再度出现错误!OK, 了解了这点, 我们就应该能够预防这里问题的出现. 我们需要的是让编译器尽可能近地处理这个常量. 查看一下编译器手册, 请使用LTORG吧。. LTORG将立刻在当前计数器上放置所有的那些已经出现,并且需要解决的常量.这样,我们在那些FUNC的尾部加上LTORG指令,就可以处理调那些加载常量导致的麻烦.
    例:
    STMFD SP!,{r0-rx};PUSH STACK
    ...FUNC BODY...
    LDMFD SP!,{r0-rx};POP STACK
    MOV PC,LR ;RETURN
    LTORG ;RESOLVE LITERAL POOL

汇编器所做的工作:
    如果LDR Rd, =const能够被转换成MOV 或者 MVN指令,则汇编器将转换成它成为相应的指令;
    如果不能被转换,则汇编器会将value存放在在一个叫做literal pool(一段嵌在代码中用以存储constant values的内存空间),并且产生一个LDR指令操作,它是Program-relativeaddress,并且是从literal pool来读这个constant value的。
    例如:
    LDR R1,=23   ;MOV R1, #23
    LDR Rn, [pc, #offset to litealpool]   ;从内存单元pc+offset处装载数据到Rn。

2.offset与pc之间的偏移量还有一定的规定:
    arm状态为<4KB,并且是双向的。
    
thumb状态为<1KB,并且只能向前(Forward) 
3.设置literal pools
    LTORG伪指令来标识。LTORG伪指令通常放在无条件跳转指令之后,或者子程序返回指令之后,这样处理器就不会错误的将文字池中的数据当作指令来执行了。
4.例程:
    AREA   Loadcon, CODE, READONLY
        ENTRY;标识第一条指令执行的地方


    start
        BL func1
    ; Branch to first subroutine
        BL func2    ; Branch to second subroutine
    stop      
        MOV r0
, #0x18
        LDR r1,=0x20026;         
        SWI 0x123456    ;ARM semihosting SWI


    func1
        LDR r0, =42
    ; 可以转换成MOV格式=> MOVR0, #42
        LDR r1, =0x55555555    ;不能转换,因为超过了MOV操作数的范围,故用literal pool => LDR R1,[PC,#offset to Literal Pool 1]
        LDR r2,=0xFFFFFFFF    ;可以转换成MVN =>MVN R2, #0  
        MOV pc, lr        ;返回到调用该函数的下一条,一般情况下将LTORG的声明放在此语句之后。
        LTORG    ;LiteralPool 1 contains;此处是存放LDRconstant values的一个embedded memory incode section!
                    ;针对此示例存放的内容为:literal Ox55555555
    func2
        LDR r3, =0x55555555
    ;=> 不能够被转换,故使用literal pool,由于0x55555555已经存在literalpool1,故可以使用literal pool1中的literal data,转换成此种形式=> LDR R3, [PC, #offset to Literal Pool 1]
        ;LDR r4, =0x66666666    ;If this is uncommented itfails, because Literal Pool2 is out of reach因为0x66666666未出现,所以这个需要存放在此代码后面的literal pool2,由于在后面分配了一块4200大小的内存块,这样与literal pool2之间的offset>4KB.若不注释掉此句话,则编译器会提示出现错误。
        MOV pc, lr    ;返回到调用该函数的下一条,
    LargeTable
        SPACE 4200
    ;Starting at the current location, clears a4200 byte area of memory to zero
         END    ;Literal Pool 2 isempty,由于没有显示声明literal pool2,故这是literal pool2的默认声明位置(程序的结束位置)


关于LTORG:
    LTORG用于声明一个文字池,在使用LDR伪指令的时候,要在适当的地址加入LTORG声明文字池,这样就会把要加载的数据保存在文字池内,再用ARM的加载指令读出数据。(若没有使用LTORG声明文字池,则汇编器会在程序末尾自动声明)。
    伪指令格式为:
        LTORG
    伪指令应用举例如下:
        ;..............
        LDR R0, =0X12345678
        ADD R1, R1, R0
        MOV PC, LR
        LTORG   ;声明文字池,此地址存储0x12345678