Thumb-2指令集

来源:互联网 发布:武器实验室5级升级数据 编辑:程序博客网 时间:2024/05/16 05:00

         Thumb‐2是一个突破性的指令集。它强大,它易用,它轻佻,它高效。Thumb‐2是16位Thumb指令集的一个超集,在Thumb‐2中,16位指令首次与32位指令并存,结果在Thumb状态下可以做的事情一下子丰富了许多,同样工作需要的指令周期数也明显下降。 

 


图1.4  Thumb-2指令集与Thumb指令集的关系 


         从图中可见,Cortex‐M3勇敢地拒绝了32位ARM指令集,却把自己的处理能力以身相许般地全托给Thumb‐2指令集。这可能有些令人意外,但事实上这却见证了Cortex‐M3的用情专一:在内核水平上,就已经为适应单片机和小内存器件而抉择、取舍过了。但她没有嫁错郎,因为Thumb‐2完全胜任在这个领域挑大梁。不过,这也意味着Cortex‐M3作为新生代处理器,不是向后兼容的。因此,为ARM7写的ARM汇编语言程序不能直接移植到CM3上来。不过,CM3支持绝大多数传统的Thumb指令,因此用Thumb指令写的汇编程序就从善如流了。

        在支持了both 16位和32位指令之后,就无需烦心地把处理器状态在Thumb和ARM之间来回的切换了。这种事在ARM7和ARM9是司空见惯的,尤其是在使用大型条件嵌套,以及执行复杂运算的时候,能精妙地游走于不同状态之间,那可是当年要成为大虾的基本功。

        Cortex‐M3作为新生代,处处闪耀着青春的光芒活力。比如,硬件除法器被带到CM3中;乘法方面,也有好几条新指令闪亮登场,用于提升data‐crunching的性能。CM3的出现,还在ARM处理器中破天荒地支持了“非对齐数据访问支持”。 

        在过去,做ARM开发必须处理好两个状态。这两个状态是井水不犯河水的,它们是:32位的ARM状态和16位的Thumb状态。当处理器在ARM状态下时,所有的指令均是32位的(哪怕只是个”NOP”指令),此时性能相当高。而在Thumb状态下,所有的指令均是16位的,代码密度提高了一倍。不过,thumb状态下的指令功能只是ARM下的一个子集,结果可能需要更多条的指令去完成相同的工作,导致处理性能下降。

       为了取长补短,很多应用程序都混合使用ARM和Thumb代码段。然而,这种混合使用是有额外开销(overhead)的,时间上的和空间上的都有,主要发生在状态切换之。另一方面,ARM代码和Thumb代码需要以不同的方式编译,这也增加了软件开发管理的复杂度。 

      伴随着Thumb‐2指令集的横空出世,终于可以在单一的操作模式下搞定所有处理了,再也没来回切换的事来烦你了。事实上,Cortex‐M3内核干脆都不支持ARM指令,中断也在Thumb态下处理(以前的ARM总是在ARM状态下处理所有的中断和异常)。这可不是小便宜,它使CM3在好几个方面都比传统的ARM处理器更先进: 
     1、  消灭了状态切换的额外开销,节省了both  执行时间和指令空间。 
     2、  不再需要把源代码文件分成按ARM编译的和按Thumb编译的,软件开发的管理大大减负。 
     3、  无需再反复地求证和测试:究竟该在何时何地切换到何种状态下,我的程序才最有效率。

    同时,不少有趣和强大的指令为Cortex‐M3注入了新鲜的青春血液,下面给出几个例子: 
    1、  UBFX,BFI,BFC: 位段提取,位段插入,位段清零。支持C位段,也简化了外设寄存器操作。 
    2、  CLZ,RBIT:   计算前导零指令和位反转指令。二者组合使用能实现一些特技 
    3、  UDIV,SDIV:   无符号除法和带符号除法指令。 
    4、 SEV,WFE,WFI: 发送事件,等待事件以及等待中断指令。用于实现多处理器之间的任务同步,还可以进入不同的休眠模式。 
    5、  MSR,MRS:   通向禁地——访问特殊功能寄存器。 
  
    但是:CM3并不支持所有的Thumb‐2指令,ARMv7‐M的规格书只要求实现Thumb‐2的一个子集。举例来说,协处理器指令就被裁掉了(可以使用外部的数据处理引擎来替代)。CM3也没有实现SIMD指令集。旧世代的一些Thumb指令不再需要,因此也被排除。不支持指令还包括v6中引入的SETEND指令。

 
0 0
原创粉丝点击