cuda中的纹理内存 二维纹理绑定错误

来源:互联网 发布:javascript在线看 编辑:程序博客网 时间:2024/05/22 07:53

        初学cuda,受了很多罪。因为在windows开发环境中,图形界面占用了很多gpu资源,因此从用了四年的vs转战到linux下的vim+nvcc+cuda-gdb。对用习惯了随手加断点,随便添监视的vs忠实用户来说,这个没有可视化、没有集成的开发环境实在是有点不习惯。再加上对于gpu程序初次接触,因此造成了开发时间的极大浪费。

        一个bug,让我调了整整两天。

        这个bug是这样的:我定义了一个设备指针,申请了一块global memory,又将该指针与一个纹理内存绑定,但是指针解引用的值与对应的纹理内存fetch的值不一致。因为我自认这个做法是按照《GPU高性能编程 CUDA实战》第七章 纹理内存 的example来的,因此很是不解(其实用过CUDA或者opengl纹理的人,可能一下就能想到是绑定纹理出了问题)。


        为什么出问题?原因就在于我使用了二维纹理。根据http://www.opengpu.org/forum.php?mod=viewthread&tid=670这篇文章的描述。linear memory(我理解的就是普通的global memory)只能与一维纹理绑定,只有CUDA Array才能与二维纹理和三维纹理绑定。但是上述书籍中的实例,linear memory与二维纹理绑定的例子确实也在用。但为什么我的代码就会出问题呢?

        直接宣布答案:当使用linear memory与二维纹理绑定时,每一维的大小必须都是2的n次幂,且两个维度的大小需相同。至于为什么,我想是因为如果不是2的n次方,那么gpu读取global memory时就不能很直接得到这两个值(因为读取操作每次必然是按照2的n次幂大小的一个块来读的),比如xResolution=yResolution=127,那么(x,y)=(0,0)与(x,y)=(0,1)这两个坐标不能通过简单操作得到(假设按照x主序);而如果xResolution=yResolution=128的话就会较容易的得到。

        这个是我大概的认识,具体原因我还没有深究,只能等对cuda了解的再深入的时候才能给出原因。