如何更快地绘制许多带纹理的四边形,并保留 glScissor(或类似的东西)?
How to draw many textured quads faster, and retain glScissor (or something like it)?
我正在使用 OpenGL 4 和 C++11。
目前,我使用带有单独 VBO 和 IBO 的单独 VAO 对 glDrawElements
进行了一大堆单独调用。
我这样做是因为每个纹理坐标都会发生变化,而我的顶点数据具有纹理坐标。我知道这个顶点数据中有一些冗余的位置信息;但是,它始终是 -1,-1,1,1,因为我在我的顶点着色器中使用平移和缩放矩阵来定位和缩放顶点数据。
VAO、VBO、IBO、位置和比例矩阵以及纹理ID存储在一个对象中。每个四边形一个对象。
目前,部分绘图会出现这样的情况:
- 通过 (
glDrawElements(GL_TRIANGLES, 6, GL_UNSIGNED_INT,0)
) 绘制四边形对象。绑定的 VBO 只是 -1,-1,1,1 而 IBO 画了一个四边形。绑定的 VBO 包含一个公共纹理的纹理坐标(相同的纹理用于纹理所有绘制的四边形)。着色器上的矩阵变换定位它。
- 用另一个四边形对象重复
调用 glEnable(GL_SCISSOR_TEST)
并在调用 glScissor
时使用预览四边形的位置信息
- 绘制下一个四边形对象;实际上只显示了从前一个四边形可见的部分。
- 绘制另一个四边形对象
我现在获得的性能是可以接受的,但我希望它更快,因为我只触及了我的想法的表面。所以我正在考虑优化。到目前为止,我已经读到我应该:
从我的顶点数据中删除位置信息,只保留纹理坐标。而是在绘制四边形开始时绑定一个位置 VBO,以便所有四边形都使用它。
但我不确定这将如何工作?因为我一次只能激活一个VBO。
然后我是否必须调用 glBufferSubData
并在绘制每个四边形之前更新纹理坐标?这会是更好的性能还是更差(为每个对象调用 glBindVertexArray
或调用 glBufferSubData
?)
我是否仍会将位置和比例作为矩阵传递给着色器,我是否会借此机会更新顶点的位置信息以及纹理坐标?哪个更快?
创建一个带或不带 IBO 的大 VBO,并更新其中每个四边形的位置顶点数据(而不是使用变换和缩放矩阵)。看来这很难管理。
即使我确实做到了;我只会接到一个 glDraw
电话;听起来很快。这是真的?单个 glBindVertexArray
调用对多个性能有何影响?
我不认为有任何方法可以使用此方法来实现类似于我现在正在进行的 glScissor
调用?
我读过的另一个选项是实例化。因此,无论我需要多少次,我都会绘制四边形;这意味着我会向着色器传递一个平移矩阵数组和一个纹理坐标数组?
这样会不会快很多?
我想我可以通过传递一个额外的布尔值数组来做类似 glScissor
测试的事情,该数组定义当前四边形是否应该只在前一个四边形的范围内绘制。但是,我认为这意味着对于每个 gl_InstanceID
我都必须遍历所有以前的实例来寻找 true 和 false 值,而且看起来会很慢。
我试图通过不单独实施所有这些来节省时间。希望专家可以指出哪个可能更好。如果有人有更好的主意,请告诉我。
- 您可以将多个 VBO 附加到不同的属性!
以下序列将 2 个 vbo 绑定到属性 0 和 1,请注意 glBindBuffer() 临时绑定缓冲区,实际的 VBO 分配到属性是在 glVertexAttribPointer() 期间进行的。
glBindBuffer(GL_ARRAY_BUFFER,buf1);
glVertexAttribPointer(0, ...);
glEnableVertexAttribArray(0);
glBindBuffer(GL_ARRAY_BUFFER,buf2);
glVertexAttribPointer(1, ...);
glEnableVertexAttribArray(1);
提供四边形位置和大小的最快方法是使用纹理并在顶点着色器中对其进行采样。当然,您至少需要 RGBA(x、y、宽度、高度)16 位/通道纹理。但是随后您可以使用 glTexSubImage2D() 更新四边形位置,或者您甚至可以通过 FBO 渲染它们。
除此之外的一切都会执行得更慢,当然,如果您愿意,我们可以详细说明如何在 vbos 中使用制服、属性或使用不启用数组的属性。
放在一起:
- 使用单个 vbo,在其中存储 quad id (int) + 你的纹理数据
- 准备 x,y,w,h 纹理,定义从 quad id 到此纹理 texcoord 的映射,即:u=quad_id&0xFF , v=(quad_id>>8)(用于纹理256x256 最多 65536 个四边形)
- 使用顶点着色器从该纹理中采样位移和大小(对于存储在属性中的给定 quad_id(或使用 vertex_ID/4 或 vertex_ID/6)
- 填充 vbo 和纹理
- 使用绘制元素的单个绘制数组绘制所有内容
我正在使用 OpenGL 4 和 C++11。
目前,我使用带有单独 VBO 和 IBO 的单独 VAO 对 glDrawElements
进行了一大堆单独调用。
我这样做是因为每个纹理坐标都会发生变化,而我的顶点数据具有纹理坐标。我知道这个顶点数据中有一些冗余的位置信息;但是,它始终是 -1,-1,1,1,因为我在我的顶点着色器中使用平移和缩放矩阵来定位和缩放顶点数据。
VAO、VBO、IBO、位置和比例矩阵以及纹理ID存储在一个对象中。每个四边形一个对象。
目前,部分绘图会出现这样的情况:
- 通过 (
glDrawElements(GL_TRIANGLES, 6, GL_UNSIGNED_INT,0)
) 绘制四边形对象。绑定的 VBO 只是 -1,-1,1,1 而 IBO 画了一个四边形。绑定的 VBO 包含一个公共纹理的纹理坐标(相同的纹理用于纹理所有绘制的四边形)。着色器上的矩阵变换定位它。 - 用另一个四边形对象重复 调用
glEnable(GL_SCISSOR_TEST)
并在调用glScissor
时使用预览四边形的位置信息
- 绘制下一个四边形对象;实际上只显示了从前一个四边形可见的部分。
- 绘制另一个四边形对象
我现在获得的性能是可以接受的,但我希望它更快,因为我只触及了我的想法的表面。所以我正在考虑优化。到目前为止,我已经读到我应该:
从我的顶点数据中删除位置信息,只保留纹理坐标。而是在绘制四边形开始时绑定一个位置 VBO,以便所有四边形都使用它。
但我不确定这将如何工作?因为我一次只能激活一个VBO。
然后我是否必须调用
glBufferSubData
并在绘制每个四边形之前更新纹理坐标?这会是更好的性能还是更差(为每个对象调用glBindVertexArray
或调用glBufferSubData
?)我是否仍会将位置和比例作为矩阵传递给着色器,我是否会借此机会更新顶点的位置信息以及纹理坐标?哪个更快?
创建一个带或不带 IBO 的大 VBO,并更新其中每个四边形的位置顶点数据(而不是使用变换和缩放矩阵)。看来这很难管理。
即使我确实做到了;我只会接到一个
glDraw
电话;听起来很快。这是真的?单个glBindVertexArray
调用对多个性能有何影响?我不认为有任何方法可以使用此方法来实现类似于我现在正在进行的
glScissor
调用?我读过的另一个选项是实例化。因此,无论我需要多少次,我都会绘制四边形;这意味着我会向着色器传递一个平移矩阵数组和一个纹理坐标数组?
这样会不会快很多?
我想我可以通过传递一个额外的布尔值数组来做类似
glScissor
测试的事情,该数组定义当前四边形是否应该只在前一个四边形的范围内绘制。但是,我认为这意味着对于每个gl_InstanceID
我都必须遍历所有以前的实例来寻找 true 和 false 值,而且看起来会很慢。
我试图通过不单独实施所有这些来节省时间。希望专家可以指出哪个可能更好。如果有人有更好的主意,请告诉我。
- 您可以将多个 VBO 附加到不同的属性!
以下序列将 2 个 vbo 绑定到属性 0 和 1,请注意 glBindBuffer() 临时绑定缓冲区,实际的 VBO 分配到属性是在 glVertexAttribPointer() 期间进行的。
glBindBuffer(GL_ARRAY_BUFFER,buf1);
glVertexAttribPointer(0, ...);
glEnableVertexAttribArray(0);
glBindBuffer(GL_ARRAY_BUFFER,buf2);
glVertexAttribPointer(1, ...);
glEnableVertexAttribArray(1);
提供四边形位置和大小的最快方法是使用纹理并在顶点着色器中对其进行采样。当然,您至少需要 RGBA(x、y、宽度、高度)16 位/通道纹理。但是随后您可以使用 glTexSubImage2D() 更新四边形位置,或者您甚至可以通过 FBO 渲染它们。
除此之外的一切都会执行得更慢,当然,如果您愿意,我们可以详细说明如何在 vbos 中使用制服、属性或使用不启用数组的属性。
放在一起:
- 使用单个 vbo,在其中存储 quad id (int) + 你的纹理数据
- 准备 x,y,w,h 纹理,定义从 quad id 到此纹理 texcoord 的映射,即:u=quad_id&0xFF , v=(quad_id>>8)(用于纹理256x256 最多 65536 个四边形)
- 使用顶点着色器从该纹理中采样位移和大小(对于存储在属性中的给定 quad_id(或使用 vertex_ID/4 或 vertex_ID/6)
- 填充 vbo 和纹理
- 使用绘制元素的单个绘制数组绘制所有内容