Draw Call

来源:互联网 发布:汤达人 知乎 编辑:程序博客网 时间:2024/05/12 14:05

转自:http://blog.csdn.net/molti/article/details/42495993


开发游戏时,一定被时时提醒要减少 Draw Call,当然Unity也不例外。打开Game Window里的 Stats,可以看到 Draw Call 与 Batched 的数字。

但到底什么是 Draw Call?影响的效能是来自 CPU?还是 GPU?

 

首先,让我们定义何为 “Draw Call”:

“一个 Draw Call,等于调用一次 DrawIndexedPrimitive (DirectX) or glDrawElements (OpenGL),等于一个 Batch”。

摸过 DirectX 或 OpenGL 的人来说,对 DrawIndexedPrimitive 与 glDrawElements 这 2个API 一定不陌生。 

当我们准备好资料 (通常为三角面的顶点信息), 要 GPU 画出来时,一定得调用这个函数。换句话说,如果在画面上有一张 “木" 椅子、一张 “铁" 桌子,那理论上就会有两个 Draw Call。有看到特别点出 “木" 与 “铁"吗?这代表两物件是使用不同材质球或者不同的 Shader。在 DirectX 或 OpenGL 里,对不同物件指定不同贴图或不同 Shader 的描述,就会需要调用两次Draw Call。 


Procedure code如下: 

SetShader("Diffuse") ;

SetTexture("铁");

DrawPrimitive(DeskVertexBuffer) ; 

SetShader("Diffuse") ;

SetTexture("木") ;

DrawPrimitive (ChairVertexBuffer) ;

 

每次对 Shader 的更动或者贴图的更动,基本上就是对 Rendering Pipeline 的设定做修改,所以需要不同的 Draw Call 来完成物件的绘制。现在了解为什么 Unity 官方文件里,老是要你尽量使用同样材质球,以减少 Draw Call 数量了吧! 

再来谈到 Batch,其实也是 Draw Call 的另一种称呼。你可以想成每一次的 Draw Call 会产生一个 Batch,而 Batch 里装的是物件顶点信息,Batch 由 CPU 透过 “驱动程式” 将顶点资料送往 GPU,GPU接手后将物件画在画面上。由此可知,越多 Draw Call,CPU 就越忙碌。这下更清楚知道 Draw Call 数量所影响的是 CPU 效能而非 GPU。

NVIDIA在GDC曾提出,25K batchs/sec 会吃满 1GHz 的 CPU,100的使用率。所以他们推出了一条公式,来预估游戏中大概可以 Run 多少个 Batch:


浅谈Draw Call和Batch的区别

举个例子:如果你的目标是游戏跑30FPS、使用2GHz的CPU、20%工作量拨给Draw Call来使用,那你每秒可以有多少Draw Call呢?

333 Batchs/Frame = 25K * 2 * (0.2/30)

那既然 Batch 是个箱子,里头装着物件的顶点信息,再依据我们上面的描述,那表示同样材质或 Shader 的物件,可以合并成一个 Batch 送往 GPU,这样就是最省事的方法!

Unity在 Player Setting 里的两个功能选项 Static Batching 与 Dynamic Batching。功能描述如下:

  1. Static Batching 是将标明为 Static 的静态物件,如果在使用相同材质球的条件下,Unity 会自动帮你把这两个物件合并成一个 Batch,送往 GPU 来处理。这功能对效能上非常的有帮助,所以是需要付费版(Pro专业版)才有的。
  2. Dynamic Batching 是在物件小于300面的条件下(不论物件是否为静态或动态),在使用相同材质球下,Unity就会自动帮你合合并成一个 Batch 送往 GPU 来处理。

根据上述的说明,相信大家对降低 Draw Call 这件事有更深一层的认识吧!还有什么不清楚或者错误的地方,还请大家能够留言回复。

以上转自:《浅谈Draw Call和Batch的区别


注:

1 原文:“一个 Draw Call,等于调用一次DrawIndexedPrimitive (DirectX) or glDrawElements(OpenGL),等于一个 Batch”。

简单的说:CPU调用一次GPU,叫做一次Draw Call 。

一个Batch,是对Draw Call的一次批量处理,或者是对Draw Call的一次合并处理。参考注2。


2 原文:每次对 Shader 的更动或者贴图的更动,基本上就是对 Rendering Pipeline 的设定做修改,所以需要不同的 Draw Call 来完成物件的绘制。

也就是说,当材质和贴图相同的时候,处理代码可以变成:

SetShader ("Diffuse") ;

SetTexture(“木和铁采用同一个贴图”) ;

DrawPrimitive("木和铁两者的顶点buffer") ;


如果可以变成这段处理流程,那么,因为只调用了一次DrawPrimitive(),所以Draw Call由2次变为了1次。

但是木和铁本身是不同的贴图和顶点,怎么能够一起处理呢?

答案是合并。通过合并纹理(Texture),和合并网格(Mesh)。将木和铁的贴图放在一张做成图集,然后开启Unity的批量处理,Unity3D就会自动合并网格。

或者借助一款强大的工具可以实现纹理和网格的合并,从而减少DrawCall:Mesh Baker工具。

合并后,注1中的Batch数就会跟着增加。

或许有人有疑惑:即便通过合并可以减少Draw Call次数,但是CPU传送给GPU的数据变多,GPU需要绘制的数据也变多,这些不会增加处理时间吗?

这个目前我还没有理论上的证明,但是根据网上的一些资料,GPU绘制一个1000面的物体,和绘制1000个1个面的物体,处理上是没有区别的。

0 0