caffe中nvcc编译目标GPU指令集的命令选项

来源:互联网 发布:mysql 语句编写 编辑:程序博客网 时间:2024/06/14 07:59

-arch: 

    指定nvcc编译目标GPU的型号,可以为“real” GPU,也可以为“virtual” PTX架构。

    这个选项指定了nvcc编译到PTX阶段的目标架构,而-code选项指定了nvcc最后阶段生成的运行时代码的目标架构。现阶段支持的架构类型有:virtual 架构 compute_10, compute_11, compute_12, compute_13和实现这些虚架构的real GPU sm_10, sm_11, sm_12, sm_13.


-code: 

    指定nvcc生成目标代码的目标GPU,支持的架构类型与-arch一样,都可以是“real”或“virtual”。

    除非指定了--export-dir,nvcc在可执行代码中为-code选项指定的每个目标GPU生成一块编译好的可加载二进制代码副本。在运行时,如果没有找到可加载二进制代码,嵌入的ptx代码会由CUDA运行时系统根据动态地编译成“current” CPU。

    当使用了-code选项时,-arch选项指定的必须是“virtual”架构。如果没有指定-code选项,那么它的缺省值就是-arch选项的值。

阅读全文
0 0
原创粉丝点击