CUDA并行编程学习心得2
来源:互联网 发布:什么软件可以做一寸照 编辑:程序博客网 时间:2024/06/03 17:23
(正在学习CUDA中, 写一些自己学习中的心得,如有错误,欢迎指正~)
P
在一个__global__函数调用__device__函数的程序中, 编译时出现错误,如下:
C:\Program Files (x86)\MSBuild\Microsoft.Cpp\v4.0\V110\BuildCustomizations\CUDA 8.0.targets(687,9): error MSB3721: 命令“"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\bin\nvcc.exe" -gencode=arch=compute_20,code=\"sm_20,compute_20\" --use-local-env --cl-version 2012 -ccbin "C:\Program Files (x86)\Microsoft Visual Studio 11.0\VC\bin\x86_amd64" -I"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\include" -I"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\include" --keep-dir x64\Release -maxrregcount=0 --machine 64 --compile -cudart static -DWIN32 -DWIN64 -DNDEBUG -D_CONSOLE -D_MBCS -Xcompiler "/EHsc /W3 /nologo /O2 /Zi /MD " -o x64\Release\kernel.cu.obj "...\kernel.cu"”已退出,返回代码为 2。
T
新建一个CUDA项目,使用系统默认的例程,在__global__函数中调用__device__函数,编译通过,结果正确。
故排除显卡版本过低的因素(因为本机显卡为GT630,计算能力2.1,所以日常怀疑显卡有问题)。尝试了好多种解决方法后, 终于找到了解决问题的方法:在__global__函数中调用这个__device__函数之前,再次声明这个__device__函数!
问题解决了,可以疑惑并没有消失。为什么其他程序可以直接调用而编译通过呢?
----------------------------------------------------------------------------------------------------------------
因为自己粗心外面的声明少了两个变量!!!
- CUDA并行编程学习心得2
- CUDA并行编程学习心得1
- CUDA-CODE5-并行编程(2)
- [CUDA]CUDA C并行编程
- CUDA并行编程入门
- [CUDA学习]3. CUDA C并行编程
- CUDA学习二:CUDA C并行编程
- 【CUDA并行程序设计系列(2)】CUDA简介及CUDA初步编程
- CUDA C的并行编程
- 并行编程1:CUDA基础
- CUDA-CODE4-并行编程-blockIDx
- CUDA-CODE5-并行编程(1)
- 《CUDA并行程序设计-GPU编程指南》读书笔记--(2)CUDA内存处理
- 《CUDA并行程序设计:GPU编程指南》
- CUDA并行编程的一个例子
- 【CUDA并行编程之四】矩阵相乘
- 【CUDA并行编程之四】矩阵相乘
- CUDA并行编程较有用的总结
- html知识点
- 设计模式——适配器模式
- 位运算的应用
- 剑指offer[二]:替换空格(java和c++版本)
- 支付宝支付集成
- CUDA并行编程学习心得2
- 通过上下文获取bean和通过bean工厂获取bean
- 约束满足问题与线性规划问题
- Hashtable,HashMap,ConcurrentHashMap 底层实现原理与线程安全问题
- ios-ContactsUI框架简单使用
- 《机器学习基石》课程笔记(2)
- LeetCode121. Best Time to Buy and Sell Stock
- 深度学习笔记:交叉熵(cross-entropy)损失函数解决二次型带来的学习速率下降问题
- 用gensim导入word2vec词向量bin文件,出现字符编码