以矩阵乘法为例,了解cpu cache对程序性能的影响
来源:互联网 发布:启明星软件金融 编辑:程序博客网 时间:2024/05/16 19:43
两段程序的唯一差别,就是把 三层循环中的 j 循环 和k 循环的顺序交换了一下。
square1.cpp中因为第三层循环(最内层循环)是对k进行循环,因此b[k][j]是对b逐列进行访问。我们知道内存中二维数组是以行为单位连续存储的,逐列访问将会每次跳1000*4(bytes)。根据cpu cache的替换策略,将会有大量的cache失效。
因此square2.cpp将j循环和k循环交换位置,这样就保证了
c[i][j] += a[i][k] * b[k][j];
这条语句对内存的访问是连续的,增加了cache的命中率,大大提升了程序执行速度。
我们来看一下实测效果:(测试环境:64位双核2.4GHz cpu)
执行时间测试:
时间居然会相差近10倍。 可见利用好cpu cache优化我们的程序,是非常有必要掌握的技能。
平时写程序时,也应当尽量使cpu对内存的访问,是尽可能连续的。
- 以矩阵乘法为例,了解cpu cache对程序性能的影响
- 以矩阵乘法为例 了解cpu cache对程序性能的影响
- cpu cache对程序性能的影响
- cache line 对程序性能的影响
- Cache 结构对程序性能的影响
- HDU4920 Matrix multiplication (CPU cache对程序的影响)
- 通过矩阵乘法看内存访问对CPU运算速度的影响
- Cpu Cache对程序性能分析
- 程序猿需要了解的CPU Cache
- 程序性能 CPU cache
- KVM Disk Cache模式对性能的影响
- sysbench工具测试query cache对性能的影响
- SQL对程序性能的影响
- SQL对程序性能的影响
- 处理器对程序性能的影响
- try catch对程序性能的影响
- 高速缓存对程序性能的影响
- CPU超频与电源设置对性能测试的影响
- oracle分析函数Rank, Dense_rank, row_number
- 多重循环的优化
- 父进程等待子进程终止 wait, WIFEXITED, WEXITSTATUS
- 判断是否为二分图
- Oracle 函数大全(字符串函数,数学函数,日期函数,逻辑运算函数,其他函数)
- 以矩阵乘法为例,了解cpu cache对程序性能的影响
- 洪水预报系统的读书笔记
- PowerDesigner 物理数据模型(PDM) 说明
- D3D9 HOOK [透视原理]
- (三):初步寻找区分病人的最佳高频/低频阈值
- [LeetCode] Trapping rain water
- IOS GHUnit常见错误信息
- 二、Cocos2dx中Android部分的c++和java实现相互调用(高级篇)
- window 搭建svn服务器