CUDA优化策略之-achieved occupancy

来源:互联网 发布:想给自己淘宝店铺刷单 编辑:程序博客网 时间:2024/05/29 17:41

概述

占用率的定义

/*SM(Streaming Multiprocessor,流式多处理器):构成GPU的基本硬件单元;
multiprocessor:在CUDA里概念和SM一样;
激活warp:在warp中的所有线程在核函数中从开始执行到全部结束的过程;
在每个SM中存在允许最大激活warp的数量;
*/
占用率(occupancy):在SM上实际激活warp数量与理论最大激活warp数量之比。占用率从warp的使用到结束都在变,不同的SM,占用率也有可能不一样。

低占用率无法隐藏延时,高占用率使得每个线程计算任务少。因此,对CUDA程序性能分析,首先要判断不同占用率对核函数性能的影响。
这里写图片描述

0 0
原创粉丝点击