矩阵转置代码,速度优化
来源:互联网 发布:东莞广电网络缴费 编辑:程序博客网 时间:2024/05/22 11:45
今天心血来潮,想写个CPU版本的矩阵转置代码,过几天写GPU版本的。
按照我的想法,就是以下几种方式:
1> 整块矩阵转置,横读纵写或纵读横写
2> 将矩阵分成固定大小的block,block与block可以分成横读纵写或纵读横写,而block内部的数据也可以横读纵写或纵读横写。
经过试验:block横读,block内部纵读,能获得最好的平均性能。
代码如下(R=read,W=write,h=horizon,v=vertical,block前面的表示block的读写方法,后面表示内容的读写方法):
结果如下:
- 矩阵转置代码,速度优化
- 测试优化速度代码
- 按速度优化JavaScript代码
- 优化PHP代码执行速度
- 如何优化代码编译速度
- VS优化Release代码速度
- VC++代码执行速度优化
- 优化网页代码提高网页访问速度
- 【代码优化】如何提高网页加载速度
- 【代码优化】如何提高网页加载速度
- 矩阵转置算法代码
- matlab 优化内存使用以及优化代码运行速度
- 测试矩阵连续运算的速度问题的代码
- HDU4920矩阵乘法优化之转置
- 优化代码,看看哪个执行速度更快!!!
- 优化代码,看看哪个执行速度更快!!!
- 最基本的C语言代码级别速度优化
- 提高asp访问速度的技巧-优化代码
- 大幅降低移动电话非稳态噪声的九个步骤
- map使用
- IT工程师必看的十条建议
- jsp页面间传递参数
- 宁要上海一张床,不要老家一栋房
- 矩阵转置代码,速度优化
- SD卡升级实现方法之UBOOT+WINCE应用
- swing也能开发界面漂亮的游戏,程序
- 工厂模式的理解
- 会员管理系统2010.3.5
- 聚类算法之K-means
- dgdg
- 安装EVC后,“Virtual pc/windows CE emulator”会造成windows不稳定解决办法
- 2010-03-05