opencl程序架构
来源:互联网 发布:淘宝网创始人有多少人 编辑:程序博客网 时间:2024/05/16 18:09
这几天研究了一下OpenCL,阅读了nvidia中的例子,归纳OpenCL程序的一般结构如下:
int main(int argc, char* argv[])
{
//获得platform
clGetPlatformIDs(1, &cpPlatform, NULL);
//获得GPU设备
clGetDeviceIDs(cpPlatform, CL_DEVICE_TYPE_GPU, 1, &cdDevice, NULL);
//创建上下文环境
hContext = clCreateContext(0, 1, &cdDevice, NULL, NULL, &ciErr);
//创建命令队列
cqCommandQueue = clCreateCommandQueue(hContext, cdDevice, 0, &ciErr);
//在设备端开辟存储区
cmDevSrc = clCreateBuffer(hContext, CL_MEM_READ_ONLY, sizeof(cl_float) * WorkSize, NULL, &ciErr);
//创建program
cpProgram = clCreateProgramWithSource(hContext, 1, &sProgramSource, NULL, NULL);
//构建program
clBuildProgram(cpProgram, 0, NULL, NULL, NULL, NULL);
//创建运行在设备端的Kernel
ckKernel = clCreateKernel(cpProgram, "VectorAdd", &ciErr);
//为Kernel设置参数
clSetKernelArg(ckKernel, 0, sizeof(cl_mem), (void*)&cmDevSrc);
//将host主存数据copy到device端
ciErr = clEnqueueWriteBuffer(cqCommandQueue, cmDevSrc, CL_FALSE, 0, sizeof(cl_float) * WorkSize, src, 0,
// 调用Kernel,执行
clEnqueueNDRangeKernel(cqCommandQueue, ckKernel, 1, NULL, (size_t*)&LocalSize, (size_t*)&WorkSize, 0, NULL, NULL);
//从device端读取计算结果到host端
clEnqueueReadBuffer(cqCommandQueue, cmDevDst, CL_TRUE, 0, sizeof(cl_float) * WorkSize, dst, 0, NULL, NULL);
return 0;
}
在运行过程中,可能会因为某些参数的设置出了问题,导致GPU端不能正确运行。这时候最好调试一下,究竟在哪里出了问题,没有得到想要的结果,这样才能够准确定位。我就在的搭配cpProgram的时候,没有进行clBuildProgram,导致后面出现问题:(。
- opencl程序架构
- OpenCL: OpenCL架构
- 【OpenCL】OpenCL架构
- opencl架构模型
- OpenCL 原理架构
- OpenCL 基础架构
- OpenCL程序框架
- opencl入门程序
- opencl build机器码程序
- OpenCL入门程序
- OpenCL程序实例
- opencl的c++程序
- 关于OpenCL架构的整理
- 一个简单的OpenCL程序
- intel opencl hello程序实例
- 使用CodeBlocks编写OpenCL程序
- OpenCL程序编程基本流程
- No.2 OpenCL 程序构建
- erlyweb连接mysql使用UTF-8
- TEXT跑马灯
- C++实现:BF算法和KMP算法
- Godday SSL证书部署(tomcat)
- vs2008卸载和vs2010的安装
- opencl程序架构
- pdf格式文件转换成mobi
- 13、输入一个单向链表,输出该链表中倒数第k个结点
- Java内存模型四
- c++ string的实现
- 并行计算、分布式计算、网格计算讲解
- uid gid euid egid详解
- 凸包
- 多线程异步编程(1):创建多个线程执行任务,同时更新进度条,使用WaitHandle发送信号