[Tips]避免cache中的抖动问题

来源:互联网 发布:淘宝香港代购 编辑:程序博客网 时间:2024/05/23 12:09

直接映射高速缓存中的冲突不命中(confict miss):
  冲突不命中在程序中很常见,会导致令人疑惑的问题。当访问大小为2的幂的数组时,直接映射高速缓冲中通常会发生冲突不命中。考虑以下计算两个向量点积的函数:

float dotdrop(float x[8], float y[8]){    float sum = 0.0;    int i;    for(i=0; i<8; ++i)    {        sum += x[i] * y[i];    }    return sum;}

  假设float是4个字节,一个块是16字节(容纳4个浮点数),高速缓存有两个组,高速缓存的大小为32字节。根据这些假设,x[i]和y[i]会被映射到相同的高速缓存组:
  |这里写图片描述
  抖动(thrash)如下:
  运行时,循环第一次迭代引用x[0],缓存不命中导致x[0]~x[3]的块被加载到组0。接下来调用y[0]时,又一次不命中,导致y[0]~y[3]的块被拷贝至组0,覆盖了x[0]~x[3]。在之后对x[1]、y[1]等的调用都会导致冲突不命中,我们就在x和y的块之间抖动,即高速缓存反复地加载和驱动高速缓存块相同的组。
  解决办法如下:在没个数组的结尾放B字节的填充,在以上代码中,不是将x定义为float x[8],而是float x[12]。可以得到以下从数组元素到组的映射:
  这里写图片描述
  对x结尾加了填充,从而将x[i]和y[i]映射到了不同的组,消除抖动。
  

0 0
原创粉丝点击