解决Unity引擎后期渲染的性能问题(转)
来源:互联网 发布:云计算产业链市场份额 编辑:程序博客网 时间:2024/05/22 07:57
一问题
Unity引擎里对渲染后期处理效果很多,如Bloom、运动模糊、景深等效果。实现过程是在作用的摄像机上加脚本并实现OnRenderImage方法,Graphics.Blit(source, destination, material);使用材质material的shader处理帧缓存的数据,再拷贝回屏幕帧缓存。
使用ImageEffect之后,发现在某些机型上(华为mate7、三星N7100),运行效率极低,明显卡顿。UnityProfiler查看真机渲染情况二调查分析Unity文档并没有相关的详细介绍,实现的细节也不得而知。论坛里Camera.AAResolve解释为与抗锯齿有关系,关闭全屏抗锯齿之后测试,确实不会卡顿了。目前主流移动 GPU 由三家公司生产,英国 Imagination 公司的 SGX 系列,美国高通公司的 Adreno 系列,以及著名显卡芯片商美国 NVIDIA 公司的移动 GeForce 系列。Arm的mali作为非主流,但在市场上有不小的份额,华为Mate7、三星N7100的GPU正是mali系列。
使用Mali Graphics Debugger查看渲染如图:在前2个drawcall里都调用了glReadPixels接口
在glReadPixels的最后个参数不为空,则表示数据从显存传输到系统内存,从CPU到GPU的逆向传输,这是非常缓慢的过程,并且是阻塞模式。
看看其它机型渲染情况,下面是高通的gpu,使用adrenoprofiler查看。它并没有调用glReadPixels,而是使用了glBindFramebuffer。FBO(Frame buffer object)在使用前需要绑定,void glBindFramebuffer(GLenum target, GLuint id);第一个参数是指定绑定操作,读、写或可读可写。第二个参数指定绑定的对象,如果是0,则是默认的帧缓存对象。
这是使用了改变渲染目标缓存的方法。
由此可知不同硬件上处理的方式不一样,具体是因为Unity内部实现的原因或是硬件支持不够。查看opengl版本的版本历史和发展最大变化的版本是OPENGL3.0。其中正式把帧缓冲对象(framebuffer object)划入core profile;帧缓冲对象之间可以互相拷贝像素到持有的不同的render target,是性能上的提升。
在FBO中使用多重采样抗锯齿,在3.0版本才加入的特性,若渲染接口不支持,则用了比较低级的API来完成获取屏幕缓存数据,导致了卡顿。
我们项目使用的是OPENGL2.0,而mali系列并没有很好的支持OPENGL2.0的接口。
用OPENGL3.0导出apk运行在华为mate7(mali系列)上,是没问题的。同样使用了改变渲染目标缓存的方法,因为3.0版本的FBO支持多采样。
三问题结论OPENGL2.0,ImageEffect屏幕后期处理时,改变渲染目标缓存,绑定FBO,若不在ProjectSettings里设置全屏抗锯齿是没问题的。若设置了全屏抗锯齿,不同硬件对不同版本OPENGL的支持不定。
四解决方案
1、关闭抗锯齿。
2、提升OPENGL版本到3.0。
3、不使用unity的OnRenderImage方法,直接使用渲染到纹理的方法。
第一种方案效果有损失,不可取;第二种可行,但版本的提升可能会有些不可预估的问题,3.0版本也弃用了很多的特性;第三种最可行,渲染到纹理的方法在绝多数机型都支持。实现方法如下:
1、摄像机上挂接一个脚本
2、Start方法,temp = RenderTexture.GetTemporary获取渲染纹理
3、Update方法,设置Camera.targetTexture = temp;
4、OnPostRender方法,设置Camera.targetTexture =null;Graphics.Blit(temp, null, material);
运行结果:此证明我的mate7还是可以的,哈哈。
Unity引擎里对渲染后期处理效果很多,如Bloom、运动模糊、景深等效果。实现过程是在作用的摄像机上加脚本并实现OnRenderImage方法,Graphics.Blit(source, destination, material);使用材质material的shader处理帧缓存的数据,再拷贝回屏幕帧缓存。
使用ImageEffect之后,发现在某些机型上(华为mate7、三星N7100),运行效率极低,明显卡顿。UnityProfiler查看真机渲染情况二调查分析Unity文档并没有相关的详细介绍,实现的细节也不得而知。论坛里Camera.AAResolve解释为与抗锯齿有关系,关闭全屏抗锯齿之后测试,确实不会卡顿了。目前主流移动 GPU 由三家公司生产,英国 Imagination 公司的 SGX 系列,美国高通公司的 Adreno 系列,以及著名显卡芯片商美国 NVIDIA 公司的移动 GeForce 系列。Arm的mali作为非主流,但在市场上有不小的份额,华为Mate7、三星N7100的GPU正是mali系列。
使用Mali Graphics Debugger查看渲染如图:在前2个drawcall里都调用了glReadPixels接口
在glReadPixels的最后个参数不为空,则表示数据从显存传输到系统内存,从CPU到GPU的逆向传输,这是非常缓慢的过程,并且是阻塞模式。
看看其它机型渲染情况,下面是高通的gpu,使用adrenoprofiler查看。它并没有调用glReadPixels,而是使用了glBindFramebuffer。FBO(Frame buffer object)在使用前需要绑定,void glBindFramebuffer(GLenum target, GLuint id);第一个参数是指定绑定操作,读、写或可读可写。第二个参数指定绑定的对象,如果是0,则是默认的帧缓存对象。
这是使用了改变渲染目标缓存的方法。
由此可知不同硬件上处理的方式不一样,具体是因为Unity内部实现的原因或是硬件支持不够。查看opengl版本的版本历史和发展最大变化的版本是OPENGL3.0。其中正式把帧缓冲对象(framebuffer object)划入core profile;帧缓冲对象之间可以互相拷贝像素到持有的不同的render target,是性能上的提升。
在FBO中使用多重采样抗锯齿,在3.0版本才加入的特性,若渲染接口不支持,则用了比较低级的API来完成获取屏幕缓存数据,导致了卡顿。
我们项目使用的是OPENGL2.0,而mali系列并没有很好的支持OPENGL2.0的接口。
用OPENGL3.0导出apk运行在华为mate7(mali系列)上,是没问题的。同样使用了改变渲染目标缓存的方法,因为3.0版本的FBO支持多采样。
三问题结论OPENGL2.0,ImageEffect屏幕后期处理时,改变渲染目标缓存,绑定FBO,若不在ProjectSettings里设置全屏抗锯齿是没问题的。若设置了全屏抗锯齿,不同硬件对不同版本OPENGL的支持不定。
四解决方案
1、关闭抗锯齿。
2、提升OPENGL版本到3.0。
3、不使用unity的OnRenderImage方法,直接使用渲染到纹理的方法。
第一种方案效果有损失,不可取;第二种可行,但版本的提升可能会有些不可预估的问题,3.0版本也弃用了很多的特性;第三种最可行,渲染到纹理的方法在绝多数机型都支持。实现方法如下:
1、摄像机上挂接一个脚本
2、Start方法,temp = RenderTexture.GetTemporary获取渲染纹理
3、Update方法,设置Camera.targetTexture = temp;
4、OnPostRender方法,设置Camera.targetTexture =null;Graphics.Blit(temp, null, material);
运行结果:此证明我的mate7还是可以的,哈哈。
阅读全文
0 0
- 解决Unity引擎后期渲染的性能问题(转)
- 解决Unity Vertex Shader 渲染丢失的问题
- 关于Unity图形渲染的性能优化
- 【U3D】后期渲染性能优化之---减少Draw Calls的调用
- Vision引擎中后期处理特效-渲染器节点介绍
- unity渲染优化的相关问题
- Unity之渲染问题
- unity 渲染问题
- 浅谈Unity的渲染优化(1): 性能分析和瓶颈判断(上篇)
- 魔术师引擎(MssEngine)的渲染
- WorldWind的渲染引擎
- 浏览器的渲染引擎
- Unity的渲染机制
- 解决vue渲染时闪烁{{}}的问题
- 解决vue渲染时闪烁{{}}的问题
- 后期屏幕渲染特效
- Cryengine渲染引擎剖析(转)
- Cryengine渲染引擎剖析(转)
- C++常用操作总结
- layui表单验证demo
- Windows下Anaconda2配置opencv2.4.9
- Pagerank的C++实现原理
- mssqlserver xp_cmdshell提权
- 解决Unity引擎后期渲染的性能问题(转)
- 记录手动处理form表单中对table表格中的行数据的收集
- vmware虚拟机启动centOs黑屏
- ES6学习之路3----rest参数与扩展运算符
- 51Nod 1031 骨牌覆盖
- 小程序接口---json格式
- opencv中ArUco识别
- 深度学习:语言模型的评估标准
- 1024. 科学计数法 (20) PAT乙级真题