CUDA学习笔记 04
来源:互联网 发布:python自动登录网页 编辑:程序博客网 时间:2024/06/16 08:18
前期写代码的时候都会困惑这个实际的threadIdx(tid,实际的线程id)到底是多少,自己写出来的对不对,今天经过自己一些小例子的推敲,以及找到官网的相关介绍,总算自己弄清楚了。
在启动kernel的时候,要通过指定gridsize和blocksize才行,举下面的例子说说:
dim3 gridsize(2,2); dim3 blocksize(4,4);
gridsize相当于是一个2*2的block,gridDim.x,gridDim.y,gridDim.z相当于这个dim3的x,y,z方向的维度,这里是2*2*1。序号从0到3,且是从上到下的顺序,就是说是下面的情况:
grid中的blockidx序号标注情况为: 0 2
1 3
blocksize则是指里面的thread的情况,blockDim.x,blockDim.y,blockDim.z相当于这个dim3的x,y,z方向的维度,这里是4*4*1.序号是0-15,也是从上到下的标注:
block中的threadidx序号标注情况: 0 4 8 12
1 5 9 13
2 6 10 14
3 7 11 15
应该这样子就一目了然了,然后求实际的tid的时候:
最后还发现了一个2D * 2D 表示threadid的二维位置的标示图, 适用于将每个threadid跟矩阵中的二维元素进行一一对应。
参考这个链接 threadIdx,blockIdx, blockDim, gridDim之间的区别与联系
- CUDA学习笔记 04
- CUDA基础学习笔记
- CUDA学习笔记
- cuda学习笔记
- CUDA学习笔记
- CUDA学习笔记
- CUDA学习笔记(1)
- CUDA学习笔记
- CUDA学习笔记
- CUDA学习笔记
- CUDA学习笔记
- cuda学习笔记
- ]CUDA学习笔记2
- CUDA学习笔记一
- CUDA学习笔记二
- CUDA学习笔记三
- CUDA学习笔记--上下文
- CUDA学习笔记(1)
- webpack使用优化(基本篇)
- JS中将变量转为字符串
- temp和undo常用的查询命令
- Bootstrap===辅助程序框架
- 项目管理软件的技巧和使用方法
- CUDA学习笔记 04
- Linux下全局安装composer方法
- Android 8.0 新特性(二)
- 工程师软技能6:理财人生精神
- QGC的MissionController
- 刷题——POJ 2395 Out of Hay
- CDH元数据的主从备份
- mysql查询多个字段同时满足多个条件,取并集
- DataBinding基本使用(2)