怎样使用深度纹理

来源:互联网 发布:jira7 linux安装 编辑:程序博客网 时间:2024/05/22 13:38

这个问题经常出现所以我试着来总结一下ATinVidia芯片对于深度纹理的支持情况如果发现我说错了nVidia的深度实现请告知我 :)

ATinVidia在硬件上都支持深度纹理虽然方法不一样深度纹理的创建非常相似:

曝光的格式
- ATi
曝光了两个FOURCC 来创建1624位深度的纹理:

#define FOURCC_DF16 ((D3DFORMAT) MAKEFOURCC('D','F','1','6'))   #define FOURCC_DF24 ((D3DFORMAT) MAKEFOURCC('D','F','2','4'))  

DF16在R300或以上的芯片(9500+)上支持而DF24 只有RV530 和以上的芯片(X1600和X1900)才支持.
- nVidia 使用预定义的D3DFMT_D16 和D3DFMT_D24S8 格式.GeForce3 和之后的芯片都支持这个.

大多数情况下16位的格式应该满足多数需要了只要你适当地选择投影矩阵(近裁剪面尽量大)并且Z的范围适当它的精度是足够的强烈建议尽可能选择16位的Shadow map, 因为它具有更好的性能而且被广泛支持.

要检测这些格式的有效性可使用CheckDeviceFormat() API. 
因此对于ATi16位深度纹理需要调用:

hres = d3d->CheckDeviceFormat(Adapter, DeviceType, AdapterFormat, D3DUSAGE_DEPTHSTENCIL, D3DRTYPE_TEXTURE, FOURCC_DF16);  

- 对于nVidia:
hres = d3d->CheckDeviceFormat(Adapter, DeviceType, AdapterFormat, D3DUSAGE_DEPTHSTENCIL, D3DRTYPE_TEXTURE, D3DFMT_D16);  

注意检查nVidia的设备ID比上面的做法更安全因为nVidia的深度纹理是重载的现有格式(一个关键的不同就是对nVidia的深度纹理进行采样返回的不是真正意义上的深度值).

纹理表面(surface)创建
同样的, ATinVidia的调用只有一点不同:
对于ATI:

hres = d3ddevice->CreateTexture(ShadowMapWidth, ShadowMapHeight, 1, D3DUSAGE_DEPTHSTENCIL, FOURCC_DF16, D3DPOOL_DEFAULT, &pShadowMap);  

- 对于nVidia:
hres = d3ddevice->CreateTexture(ShadowMapWidth, ShadowMapHeight, 1, D3DUSAGE_DEPTHSTENCIL, D3DFMT_D16,  D3DPOOL_DEFAULT, &pShadowMap);  

中间的设置(surface绑定, viewport, 等等两者都是一样的.

当渲染完成后深度纹理可以当作是一张普通纹理通过SetTexture() 来使用.

* ATinVidia的深度纹理实现的主要不同是在shader的使用上.
ATi深度纹理进行采样会返回深度值这需要shader取出深度并与输入的Z值进行比较这样允许更为灵活的为每个采样选择滤波掩模(kernel)和权重. X1600X1900支持一项叫做Fetch4的特性它会在每次纹理指令执行时返回四个邻近的深度采样到目标RGBA通道这就使高性能的shadow map和更大的掩模成为可能.
nVidia的深度纹理进行采样会返回PCF(Percentage-Closer-Filtered)的结果并且在采样的同时会自动与输入的Z值做比较.

自动迎合ATinVidia版本的深度纹理创建应该是很简单的因为它们在代码上非常相似大部分的工作在于HLSL shader代码中的#ifdef来区分ATinVidia风格的逐像素阴影贡献计算双方的开发网站上都有相应的代码和shader示例和文档.


为了确保高性能有两条值得注意的事情(基于实际的例子:)):

记着在渲染投影物体到深度纹理时关闭颜色写入(color write). 大多数情况下你会对深度纹理的内容感兴趣(运行时需要绑定一个有效的跟深度纹理/纹理大小一致的颜色缓冲(color buffer)). "忘记"关闭颜色写入会引起不必要的颜色缓冲带宽消耗.

关于渲染透明(alpha测试)投影物体到深度纹理确保只对需要透明的三角形开启了alpha测试 (或者texkill 如果目标surface不能与
D3DUSAGE_QUERY_POSTPIXELSHADER_BLENDING
一起使用). 为所有投影物体 保持alpha测试开着(或使用一个texkill
shader)
会让早期的Z优势失效因为pixel shader可能会在深度比较之前执行.
所有阴影渲染也可以使用同一个灵活的shader, 但这需要付出额外的步骤:)


Nick
European Developer Relations, ATI Technologies 
MrT@ati.com 


http://blog.csdn.net/xoyojank/article/details/4149334

0 0
原创粉丝点击