CUDA学习(四)初探
来源:互联网 发布:梦龙网络计划编制软件 编辑:程序博客网 时间:2024/05/19 03:43
CUDA核函数与运行时参数
<<<>>>运算符对kernel函数完整的执行配置参数形式是<<<Dg, Db, Ns, S>>>
核函数是GPU每个thread上运行的程序。必须通过__gloabl__函数类型限定符定义。形式如下:
__global__ void kernel(param list){ }
核函数只能在主机端调用,调用时必须申明执行参数。调用形式如下:
ernel<<<Dg,Db, Ns, S>>>(param list);
<<<>>>运算符对kernel函数完整的执行配置参数形式是<<<Dg, Db, Ns, S>>>
- 参数Dg用于定义整个grid的维度和尺寸,即一个grid有多少个block。为dim3类型。Dim3 Dg(Dg.x, Dg.y, 1)表示grid中每行有Dg.x个block,每列有Dg.y个block,第三维恒为1(目前一个核函数只有一个grid)。整个grid中共有Dg.x*Dg.y个block,其中Dg.x和Dg.y最大值为65535。
- 参数Db用于定义一个block的维度和尺寸,即一个block有多少个thread。为dim3类型。Dim3 Db(Db.x, Db.y, Db.z)表示整个block中每行有Db.x个thread,每列有Db.y个thread,高度为Db.z。Db.x和Db.y最大值为512,Db.z最大值为62。 一个block中共有Db.x*Db.y*Db.z个thread。计算能力为1.0,1.1的硬件该乘积的最大值为768,计算能力为1.2,1.3的硬件支持的最大值为1024。
- 参数Ns是一个可选参数,用于设置每个block除了静态分配的shared Memory以外,最多能动态分配的shared memory大小,单位为byte。不需要动态分配时该值为0或省略不写。
- 参数S是一个cudaStream_t类型的可选参数,初始值为零,表示该核函数处在哪个流之中。
0 0
- CUDA学习(四)初探
- CUDA学习(四)
- CUDA 学习(四)、线程
- cuda编程基础学习初探
- Cuda 学习教程(四):Cuda程序的优化
- CUDA学习之四
- CUDA学习笔记四
- CUDA学习笔记四
- 深入浅出CUDA(四)
- (四)Hello CUDA!
- CUDA学习(四)流沙上建高楼
- 《GPU高性能编程CUDA实战》学习笔记(四)
- Cuda 学习教程四:GPU和Cuda逻辑关系
- tolua++初探(四)
- Oracle初探(四)
- 初探UiAutomator(四)
- 异常初探(四)
- 多线程初探(四)
- QML动画与过度
- Android进程的五个等级
- Linux终端缩短路径名
- CocoaPods详解之----制作篇
- web手势库AlloyFinger运用( 控制CANVAS中图片移动、缩放、旋转)
- CUDA学习(四)初探
- 26个字母和数字符号ASCII码对照表
- Android如何在activity中控制屏幕点亮与关闭
- 浅谈C/C++ 开发Excel插件之操作excel
- 1078 - Integer Divisibility
- 关于小米手机及一些使用相册去选取图片的手机的一些问题
- php checkbox 取值详细说明
- 预压缩处理图片 options.inJustDecodeBounds = true
- zabbix agent类型的所有key 值