cuda的初始化
来源:互联网 发布:卡迪夫 知乎 编辑:程序博客网 时间:2024/05/17 02:08
http://www.cnblogs.com/dflower/archive/2009/10/16/1584827.html
首先介绍一下开发环境,Visual Studio 2008 + CUDA Wizard for Visual Studio. 确保显卡支持CUDA(GeForce 8系列之后,否则只能用模拟模式)并安装CUDA DDK及CUDA Toolkit。
安装完CUDA Wizard for Visual Studio之后,如果编译运行时出现"无法找到cutil32D.dll"的错误,则需要将安装的CUDA的sdk的路径加到系统环境变量中:
例如C:\Program Files\NVIDIA Corporation\NVIDIA CUDA SDK\bin\win32\
下的
├─Debug
├─EmuDebug
├─EmuRelease
└─Release
几个目录都加入到系统环境变量Path中,这样才能在运行程序的时候找到相应的dll库。
然后就可以在VS下直接编译CUDA程序了(*.cu)。以下是一个CUDA初始化的程序。
- #include <stdio.h>
- #include <cuda_runtime.h>
- bool InitCUDA()
- {
- int count;
- cudaGetDeviceCount(&count);
- if(count==0)
- {
- fprintf(stderr,"There is no device.\n");
- return false;
- }
- int i;
- for(i=0;i<count;i++)
- {
- cudaDeviceProp prop;
- if(cudaGetDeviceProperties(&prop,i) == cudaSuccess)
- {
- if(prop.major>=1)
- {
- //枚举详细信息
- printf("Identify: %s\n",prop.name);
- printf("Host Memory: %d\n",prop.canMapHostMemory);
- printf("Clock Rate: %d khz\n",prop.clockRate);
- printf("Compute Mode: %d\n",prop.computeMode);
- printf("Device Overlap: %d\n",prop.deviceOverlap);
- printf("Integrated: %d\n",prop.integrated);
- printf("Kernel Exec Timeout Enabled: %d\n",prop.kernelExecTimeoutEnabled);
- printf("Max Grid Size: %d * %d * %d\n",prop.maxGridSize[0],prop.maxGridSize[1],prop.maxGridSize[2]);
- printf("Max Threads Dim: %d * %d * %d\n",prop.maxThreadsDim[0],prop.maxThreadsDim[1],prop.maxThreadsDim[2]);
- printf("Max Threads per Block: %d\n",prop.maxThreadsPerBlock);
- printf("Maximum Pitch: %d bytes\n",prop.memPitch);
- printf("Minor Compute Capability: %d\n",prop.minor);
- printf("Number of Multiprocessors: %d\n",prop.multiProcessorCount);
- printf("32bit Registers Availble per Block: %d\n",prop.regsPerBlock);
- printf("Shared Memory Available per Block: %d bytes\n",prop.sharedMemPerBlock);
- printf("Alignment Requirement for Textures: %d\n",prop.textureAlignment);
- printf("Constant Memory Available: %d bytes\n",prop.totalConstMem);
- printf("Global Memory Available: %d bytes\n",prop.totalGlobalMem);
- printf("Warp Size: %d threads\n",prop.warpSize);
- break;
- }
- }
- }
- if(i==count)
- {
- fprintf(stderr,"There is no device supporting CUDA.\n");
- return false;
- }
- cudaSetDevice(i);
- return true;
- }
- void main()
- {
- if(!InitCUDA())
- {
- getchar();
- return;
- }
- printf("CUDA initialized.\n");
- getchar();
- }
运行结果如下:
- CUDA的初始化
- cuda的初始化
- cuda初始化代码
- Cuda 学习教程:Cuda 程序初始化
- linux下cuda设备初始化
- CUDA全局变量(__device__)的初始化与使用:cudaMemoryToSymbol、cudaMemoryFromSymbol、cudaGetSymbolAddress
- CUDA编程(二) CUDA初始化与核函数
- CUDA编程(二) CUDA初始化与核函数
- [CUDA] 有关CUDA的一些配置
- CUDA学习十:CUDA的总结
- cuda编程---cuda的速度计量
- 浅谈CUDA的局限性
- opencv的CUDA支持
- CUDA的执行模式
- CUDA的编译
- 开始CUDA的研究
- CUDA的配置
- CUDA的配置
- CentOS安装squid代理服务器
- linux使用git对github项目管理
- Ext.get与Ext.fly 的区别
- 遍历Map的几种方法
- 一些面试考点的准备
- cuda的初始化
- VM虚拟机下在LINUX上安装ORACLE 11G单实例数据库
- 服务器裸机安装CentOS 无光驱
- WPF中DataGrid控件的过滤(Filter)性能分析及优化
- 周鸿祎:别为蝇头小利放弃重要学习机会
- 快排
- CentOS 中配置 vsftpd 总结
- C/C++内存泄漏及检测
- uva 327 Evaluating Simple C Expressions