哪些开销与实例化渲染相关?

What overhead is associated with instanced rendering?

我正在构建一个大量使用实例化渲染的渲染系统。据我了解,实例化渲染通常效率更高,因为它可以减少总绘制调用和必须存储在 GPU 上的原始顶点数据量。

我预计,在某些时候,与简单地发送原始顶点数据相比,实例化渲染会产生开销。我当前的绘图系统将产生许多实例(数千个)非常小的顶点数据(每个 6 个顶点)。

实例化渲染非常适合我的绘图系统,让我可以避免生成任何 "redundant" 顶点数据,但我担心绘制这么多小实例会给 GPU 带来额外的压力。是这样吗?

是这样的。 https://devforums.apple.com/message/1136832#1136832

为获得最佳性能,您必须一次处理 32 个顶点的倍数。因此,您在简单性和效率之间的最佳折衷可能是每个实例绘制 16 个东西。