CUDA编译器nvcc的用法用例与问题简答

来源:互联网 发布:被绿是怎样体验知乎 编辑:程序博客网 时间:2024/06/05 04:31

本文使用nvcc版本:Cuda compilation tools, release 5.5, V5.5.0


1.nvcc支持OpenMP

书写makefile时,使用-fopenmp命令选项时会报nvcc fatal : Unknown option ‘fopenmp’错误。正确的编译选项是:

-Xcompiler -fopenmp

2.nvcc指定GPU计算能力

在内核中调用原子函数(例如atomicAdd)时,如果编译的时候出现”error: identifier “atomicAdd” is undefined”;

那么首先要确定的GPU显卡计算能力是否在1.1或者1.1以上,原子性操作在低端的计算能力 GPU 是不支持的,1.1 以上的计算能力才支持全局内存的原子操作,1.2 以上的计算能力才支持共享内存的原子操作。

使用原子操作的话在编译的时候需要指明GPU的计算能力,添加如下nvcc的编译选项:

-gencode=arch=compute_35,code=\"sm_35,compute_35\"

3.nvcc提示警告

使用 nvcc -Wall时会提示nvcc fatal : Unknown option ‘Wall’的错误。原来nvcc默认开启所有警告,如果想禁止警告,使用-w编译选项。

具体使用nvcc --help查看帮助。


附1 nvcc编译CUDA实际项目makefile

# Check for 32-bit vs 64-bitPROC_TYPE = $(strip $(shell uname -m | grep 64))ifeq ($(PROC_TYPE),)    FLAGS+= -m32else    FLAGS+= -m64endif#cuda install pathCUDA_INSTALL_PATH ?= /usr/local/cuda-5.5#environment variable VPATHVPATH=./include#gpu architectureGENCODE_SM35 := -gencode=arch=compute_35,code=\"sm_35,compute_35\"CXX=nvccCXXFLAGS=-g -Xcompiler -fopenmp -DDEBUGCXXFLAGS+=$(FLAGS) $(GENCODE_SM35)#source filesCXXFILES = $(wildcard src/*.cpp)CUFILES  =$(wildcard src/*.cu)#header filesINCLUDES= -Iinclude -I${CUDA_INSTALL_PATH}/include#static libLIBDIR=./libLIBS=$(LIBDIR)/libxmlextern.a#preprocessOBJDIR=./objNOTDIR_CXXFILES=$(notdir ${CXXFILES})NOTDIR_CUFILES=$(notdir ${CUFILES})OBJS=$(addprefix ./obj/,$(patsubst %.cpp,%.o,${NOTDIR_CXXFILES})) OBJS+=$(addprefix ./obj/,$(patsubst %.cu,%.o,${NOTDIR_CUFILES})) #compileDICUALG.out:${OBJS}    $(MAKE) -C ./src/xmlparser    $(CXX) -Xcompiler -fopenmp -o $@ $^ $(LIBS) ${OBJDIR}/%.o :src/%.cpp    $(CXX) ${CXXFLAGS} ${INCLUDES} -c  $< -o $@${OBJDIR}/%.o :src/%.cu    $(CXX) ${CXXFLAGS} ${INCLUDES} -c  $< -o $@${OBJDIR}/md5.o ${OBJDIR}/common.o:macro.h${OBJDIR}/GPU_Decomposer3.o:cnre.h gpu_define3.h global.h .PHONY:cleanclean:    rm obj/* ./DICUALG.out

具体不详细解释,有问题可留言提问。


参考文献

[1]NVCC命令编译选项.http://blog.csdn.net/k346k346/article/details/50377714
[2]http://www.tuicool.com/articles/uIj2q2

1 0
原创粉丝点击