图解数据读写与Cache操作

来源:互联网 发布:淘宝客 流量劫持 编辑:程序博客网 时间:2024/06/01 13:16

  高速缓存(Cache)主要是为了解决CPU运算速度与内存(Memory)读写速度不匹配的矛盾而存在, 是CPU与内存之间的临时存贮器,容量小,但是交换速度比内存快。

  百度百科是这样介绍缓存读取的:

  CPU要读取一个数据时,首先从Cache中查找,如果找到就立即读取并送给CPU处理;如果没有找到,就用相对慢的速度从内存中读取并送给CPU处理,同时把这个数据所在的数据块调入Cache中,可以使得以后对整块数据的读取都从Cache中进行,不必再调用内存。
  正是这样的读取机制使CPU读取Cache的命中率非常高(大多数CPU可达90%左右),也就是说CPU下一次要读取的数据90%都在Cache中,只有大约10%需要从内存读取。这大大节省了CPU直接读取内存的时间,也使CPU读取数据时基本无需等待。总的来说,CPU读取数据的顺序是先Cache后内存。

  本文仅针对Cache的读写进行简单说明并通过示意图演示什么时候需要写回(flush)缓存,什么时候需要作废(Invalidate)缓存。
  Cache分为针对指令缓存的I-Cache和数据缓存的D-Cache,平时D-Cache访问比较多,以下主要讨论数据访问的D-Cache,指令缓存I-Cache原理一样。
  

Cache读写原理
  图一、Cache读写原理
  
  写入数据时:
  第一步,CPU将数据写入Cache;
  第二步,将Cache数据传送到Memory中相应的位置;
  读取数据时:
  第一步,将Memory中的数据传送到Cache中;
  第二步,CPU从Cache中读取数据;

  在具体的硬件实现上,Cache有写操作有透写(Write-Through)和回写(Write-Back)两种方式:
在透写式Cache中,CPU的数据总是写入到内存中,如果对应内存位置的数据在Cache中有一个备份,那么这个备份也要更新,保证内存和Cache中的数据永远同步。所以每次操作总会执行图一中的步骤1和2。
  在回写式Cache中,把要写的数据只写到Cache中,并对Cache对应的位置做一个标记,只在必要的时候才会将数据更新到内存中。所以每次写操作都会执行步骤中的图1,但并不是每次执行步骤1后都执行步骤2操作。
  透写方式存在性能瓶颈,性能低于回写方式,现在的CPU设计基本上都是采用Cache回写方式。

  通常情况下,数据只通过CPU进行访问,每次访问都会经过Cache,此时数据同步不会有问题。
  在有设备进行DMA操作的情况下,设备读写数据不再通过Cache,而是直接访问内存。在设备和CPU读写同一块内存时,所取得的数据可能会不一致,如图二。
  
设备和CPU读写同一块内存时数据不一致
  图二、设备和CPU读写同一块内存时数据不一致

  CPU执行步骤1将数据A写入Cache,但并不是每次都会执行步骤2将数据A同步到内存,导致Cache中的数据A和内存中的数据A’不一致;步骤3中,外部设备通过DMA操作时直接从内存访问数据,从而取得的是A’而不是A。
  设备DMA操作完成后,通过步骤4将数据B写入内存;但是由于内存中的数据不会和Cache自动进行同步,步骤5不会被执行,所以CPU执行步骤3读取时数据时,获取的可能是Cache中的数据B’,而不是内存中的数据B;

  在CPU和外设访问同一片内存区域的情况下,如何操作Cache以确保设备和CPU访问的数据一致就显得尤为重要,见图三。

Cache操作同步数据
  图三、Cache操作同步数据

  CPU执行步骤1将数据A写入Cache,由于设备也需要访问数据A,因此执行步骤2将数据A通过flush 操作同步到内存;步骤3中,外部设备通过DMA操作时直接从内存访问数据A,最终CPU和设备访问的都是相同的数据。
  设备DMA操作完成后,通过步骤4将数据B写入内存;由于CPU也需要访问数据B,访问前通过invalidate操作作废Cache中的数据,从而通过Cache读取数据时Cache会从内存取数据,所以CPU执行步骤6读取数据时,获取到的是从内存更新后的数据;

  Cache操作举例:
  外部设备I/O和DMA传输。
  例如,在博通机顶盒平台中,内存加解密在单独的安全芯片中进行,安全芯片访问的数据通过DMA进行传输操作。因此,在进行内存加解密前,需要flush D-Cache操作将数据同步到到内存中供安全芯片访问;加解密完成后需要执行invalidate D-Cache操作,以确保CPU访问的数据是安全芯片加解密的结果,而不是Cache之前保存的数据;
  nand flash的控制器也支持DMA读取的方式。在数据向nand flash写入数据时需要先flash dcache确保DMA操作的数据是真实要写如的数据,而不是内存中已经过期的数据;从nand flash读取数据后需要invalidate dcache,使cache中的数据失效,从而确保cpu读取的是内存数据,而不是上一次访问时缓存的结果。
  Cache总是分为I-Cache和D-Cache,取指令时访问I-Cache,读写数据时访问D-Cache。
如果一段代码保存在外设(如nand flash或硬盘)上,CPU想执行这段代码,需要先将这段代码作为数据复制到内存再将这段代码作为指令执行。由于写入数据和读取指令分别通过D-Cache和I-Cache,所以需要同步D-Cache和I-Cache,即复制后需要先将D-Cache写回到内存,而且还需要作废当前的I-Cache以确保执行的是Memory内更新的代码,而不是I-Cache中缓存的数据,如图四所示:

CPU复制代码后再执行
  图四、CPU复制代码后执行

0 0