CUDA SDK VolumeRender:跨编译单元调用
来源:互联网 发布:js判断汉字长度 编辑:程序博客网 时间:2024/06/03 09:16
有关VolumeRender的介绍、和CUDA SDK中的VolumeRender解析在HERESY的一些文章中写的非常详细,这里我只想写写我对VolumeRender这个例子的一些理解。
曾经遇到过cuda函数在跨编译单元调用的问题,这个例子用到了一个很巧妙的解决方法。
首先描述下这个问题,当多个cu或cpp文件互相包含的时候cu文件中的实现会被nvcc生成在多个编译单元中,从而出现重定义链接错误。具体描述见这里。
CUDA SDK中避免此问题的方法是,添加一个extern层接口,需要被外部使用的功能封装为extern接口,接口函数和实现函数放在一个cu中,调用端通过extern的声明来找到接口,这样避免了实现出现在多个编译单元内(只有函数实现所在的编译单元)。
有点乱?下面给出VolumeRender中的用法:
实现部分:
// volumeRender_kernel.cu__global__ voidd_render(uint *d_output, uint imageW, uint imageH, float density, float brightness, float transferOffset, float transferScale){ // implemention}
全局接口和实现在同一文件:
// volumeRender_kernel.cuextern "C" void render_kernel(dim3 gridSize, dim3 blockSize, uint *d_output, uint imageW, uint imageH, float density, float brightness, float transferOffset, float transferScale){ d_render<<>>( d_output, imageW, imageH, density, brightness, transferOffset, transferScale);}
调用端使用声明绕开包含:
1: // volumeRender.cpp
2: extern "C" void render_kernel(dim3 gridSize, dim3 blockSize, uint *d_output, uint imageW, uint imageH,
3: float density, float brightness, float transferOffset, float transferScale);
2: extern "C" void render_kernel(dim3 gridSize, dim3 blockSize, uint *d_output, uint imageW, uint imageH,
3: float density, float brightness, float transferOffset, float transferScale);
如果你对这个问题很感兴趣,这里有一个完整的解决方案。
http://cuda.it168.com/a2011/1018/1260/000001260437.shtml
- CUDA SDK VolumeRender:跨编译单元调用
- CUDA SDK VolumeRender 分析
- CUDA SDK VolumeRender
- CUDA SDK VolumeRender 分析
- 编译单元
- CUDA 的硬件单元映射
- CUDA运算单元速度和选择
- DEV调用单元说明。
- [C++再学习系列] 跨编译单元的对象初始化
- openwrt 调用编译好的SDK的环璄
- CUDA SDK示例程序概览
- CUDA文件编译命令行
- CUDA文件编译错误
- CUDA的编译
- CUDA 编译过程
- opencv +cuda +tpp编译
- CUDA编译问题
- cuda-convnet2编译
- 迂者-贺利坚的博文体会
- TCP/UDP协议
- 原来order by 中也可以使用子查询
- 【超级经典】程序员装B指南(转)
- OpenGl中DDA算法画直线
- CUDA SDK VolumeRender:跨编译单元调用
- linux设置JDK环境变量
- 看着别人的努力羡慕一下然后转身回去过自己的生活的你,又凭什么去过自己想要的人生?
- 用willDisplayCell改变TableViewCell颜色
- pair VS make_pair(转)
- 传智播客-Java学科-10月份HTML5游戏开发公开课
- MySql备份还原命令
- ACE初学者使用指南
- OpenGl中点Bresenham算法画直线