性能优化

来源:互联网 发布:js的事件onchange 编辑:程序博客网 时间:2024/05/17 17:56

(一)cache性能

  1. Integrated 533 MHz MIPS32® 74K® core, 32 KB I-cache, 32 KB D-cache
  2. OCTEON CN56XX consists of four different software- and pin-compatible parts with 6 to 12 cnMIPS cores, running at clock speeds of up to 1 Gigahertz, along with integrated dual 72-bit DDR2 memory controllers and a 2MB L2 cache.
  3. 快转buffer

(二)缓冲池性能

  1. 专用缓冲池
申请释放速度更快,由于通用池的申请释放是在专用池之上封装了一层,故直接用专用池能省去这层封装效率更高。
空间利用率上要比通用池高(只能申请固定大小的内存块),在大量小内存对象的应用情况中,专用池可以减少内存碎片。

  1. 硬件加速

硬件管理报文buffer,不需手动释放。

 

(三)报文分片重组

(四)二层转发性能

(五)地址表查找性能

(六)轮询&中断

(七)内存对齐

Exception 4/5Address Error Load/Write,如果试图访问一个非对齐的地址,例如lw/sw指令的地址非4字节对齐,或lh/sh的地址非2字节对齐,就会触发这个异常。一般地,操作系统在Exception Handler中对这个异常的处理,是分开两次读取/写入这个地址。虽然一般的操作系统内核都处理了这个异常,最后能够完成期待的操作,但是由于会引起用户态到内核态的切换,以及异常的退出,当这样非对齐操作较多时会严重影响程序的运行效率。因此,编译器在定义局部和全局变量时,都会自动考虑到对齐的情况,而程序员在设计数据结构时,则需要对对齐做特别的斟酌。

原创粉丝点击