大型合并网格的低 FPS

Low FPS for large merged mesh

我尝试渲染一组 3d 模型。我将网格合并为一个具有 200k 个顶点的网格。具有位置、法线和纹理坐标属性。我使用 VBO 但不使用索引缓冲区对象。我只进行了 2 次渲染调用（一次用于阴影）。我用 libgdx.

我希望在我的 Galaxy j3 (2016) 上从合并的网格中获得良好的 FPS，但我得到了 13 FPS。在 galaxy s8 和 nexus 5 上，我得到了 60 FPS。

那么问题是什么？
Galaxy j3 对于 200k 顶点来说是不是太弱了？
或者 200k 顶点网格太大？

银河J3特点：
CPU：展讯 SC9830I 四核，1.5 ΓΓц。
内存：1.5 Gb。
GPU：ARM Mali-400 MP2。

Mali-400 是一种旧设计，只有一个非常单一的顶点处理器，不会随着内核数量的增加而扩展，因此它肯定会与顶点复杂度作斗争，复杂度为 shader cost * vertex count。

值得注意的是，将所有内容合并到一次抽奖中通常会适得其反。您希望将绘制调用次数减少到 CPU 可以处理的程度，但是一旦您的绘制调用次数少于几百次，它就不太可能给您带来太多好处，您会错失很多机会。例如，您失去了在 CPU 上剔除视锥体外对象的能力，即使在更现代的 GPU 上也是强烈推荐的最佳实践。