使用 glDrawElementsInstanced 进行实例渲染时的行为不一致,有时无法正常渲染
Inconsistent behavior in instance rendering with glDrawElementsInstanced, somtimes no rendering with no errors
我一直在使用 OpenGL 开发项目。使用实例化绘制调用渲染粒子。
问题是有时 glDrawElementsInstanced 不会渲染任何东西。并且没有报错。其他模型和效果渲染良好。但是里面没有颗粒
我的粒子系统将渲染。绘图调用看起来像
ec(glBindVertexArray(vao));
ec(glBindBuffer(GL_ELEMENT_ARRAY_BUFFER, ebo));
ec(glDrawElementsInstanced(GL_TRIANGLES, triangleElementIndices.size(), GL_UNSIGNED_INT, reinterpret_cast<void*>(0), instanceCount));
ec
是一个用于 e
错误 c
heck opengl 的宏。它有效地做到了这一点:
while (GLenum error = glGetError()){
std::cerr << "OpenGLError:" << std::hex << error << " " << functionName << " " << file << " " << line << std::endl;
}
渲染粒子问题在发布模式下更为普遍,而不是在调试模式下;但在两种模式下都会发生。问题发生在发布模式下 8/10
和调试模式下 1/10
。
下面是粒子的渲染过程:
对于每个实例化的绘制调用...
- 绑定一个共享的顶点缓冲区对象(vbo)
- 将数据放入该顶点缓冲区对象 (vbo)
- 遍历许多顶点数组对象 (vao),将 VBO 与它们相关联并设置顶点属性
- 渲染每个 vao
所有对象共享同一个 VBO,但它们是按顺序呈现的。整个应用程序目前是单线程的,所以这应该不是问题。
粒子 A(两个 vaos)和粒子 B(一个 vao)的给定框架如下:
- -将 A 的数据缓冲到名为 VBO
的顶点缓冲区中
- -绑定A_vao1
- -设置A的实例顶点属性
- -绑定A_vao2
- -设置A的实例顶点属性
- -渲染A_vao1
- -渲染A_vao2
- -缓冲区 B 的数据进入顶点缓冲区名称 VBO(没有 glGenBuffers,这是同一个缓冲区)
- -绑定B_vao1
- -设置B的实例顶点属性
- -渲染B_vao1
这种方法有明显的问题吗?
下面的源代码已经过简化,但我保留了大部分相关部分。与我上面的不同,它实际上使用了 2 个共享顶点缓冲区对象 (VBO),一个用于 matrix4s,一个用于 vector4s。
GLuint instanceMat4VBO = ... //valid created vertex buffer objects
GLuint instanceVec4VBO = ... //valid created vertex buffer objects
//iterate over all the instnaces; data is stored in class EffectInstanceData
for(EffectInstanceData& eid : instancedEffectsData)
{
if (eid.numInstancesThisFrame > 0)
{
// ---- BUFFER data ---- before binding it to all VAOs (model's may have multiple meshes, each with their own VAO)
ec(glBindBuffer(GL_ARRAY_BUFFER, instanceMac4VBO)); //BUFFER MAT4 INSTANCE DATA
ec(glBufferData(GL_ARRAY_BUFFER, sizeof(glm::mat4) * eid.mat4Data.size(), &eid.mat4Data[0], GL_STATIC_DRAW));
ec(glBindBuffer(GL_ARRAY_BUFFER, instanceVec4VBO)); //BUFFER VEC4 INSTANCE DATA
ec(glBufferData(GL_ARRAY_BUFFER, sizeof(glm::vec4) * eid.vec4Data.size(), &eid.vec4Data[0], GL_STATIC_DRAW));
//meshes may have multiple VAO's that need rendering, set up buffers with instance data for each VAO before instance rendering is done
for (GLuint effectVAO : eid.effectData->mesh->getVAOs())
{
ec(glBindVertexArray(effectVAO));
{ //set up mat4 buffer
ec(glBindBuffer(GL_ARRAY_BUFFER, instanceMat4VBO));
GLsizei numVec4AttribsInBuffer = 4 * eid.numMat4PerInstance;
size_t packagedVec4Idx_matbuffer = 0;
//pass built-in data into instanced array vertex attribute
{
//mat4 (these take 4 separate vec4s)
{
//model matrix
ec(glEnableVertexAttribArray(8));
ec(glEnableVertexAttribArray(9));
ec(glEnableVertexAttribArray(10));
ec(glEnableVertexAttribArray(11));
ec(glVertexAttribPointer(8, 4, GL_FLOAT, GL_FALSE, numVec4AttribsInBuffer * sizeof(glm::vec4), reinterpret_cast<void*>(packagedVec4Idx_matbuffer++ * sizeof(glm::vec4))));
ec(glVertexAttribPointer(9, 4, GL_FLOAT, GL_FALSE, numVec4AttribsInBuffer * sizeof(glm::vec4), reinterpret_cast<void*>(packagedVec4Idx_matbuffer++ * sizeof(glm::vec4))));
ec(glVertexAttribPointer(10, 4, GL_FLOAT, GL_FALSE, numVec4AttribsInBuffer * sizeof(glm::vec4), reinterpret_cast<void*>(packagedVec4Idx_matbuffer++ * sizeof(glm::vec4))));
ec(glVertexAttribPointer(11, 4, GL_FLOAT, GL_FALSE, numVec4AttribsInBuffer * sizeof(glm::vec4), reinterpret_cast<void*>(packagedVec4Idx_matbuffer++ * sizeof(glm::vec4))));
ec(glVertexAttribDivisor(8, 1));
ec(glVertexAttribDivisor(9, 1));
ec(glVertexAttribDivisor(10, 1));
ec(glVertexAttribDivisor(11, 1));
}
}
}
{ //set up vec4 buffer
ec(glBindBuffer(GL_ARRAY_BUFFER, instanceVec4VBO));
GLsizei numVec4AttribsInBuffer = eid.numVec4PerInstance;
size_t packagedVec4Idx_v4buffer = 0;
{
//package built-in vec4s
ec(glEnableVertexAttribArray(7));
ec(glVertexAttribPointer(7, 4, GL_FLOAT, GL_FALSE, numVec4AttribsInBuffer * sizeof(glm::vec4), reinterpret_cast<void*>(packagedVec4Idx_v4buffer++ * sizeof(glm::vec4))));
ec(glVertexAttribDivisor(7, 1));
}
}
}
//activate shader
... code setting uniforms on shaders, does not appear to be issue...
//instanced render
for (GLuint vao : eid.effectData->mesh->getVAOs()) //this actually results in function calls to a mesh class instances, but effectively is doing this loop
{
ec(glBindVertexArray(vao));
ec(glBindBuffer(GL_ELEMENT_ARRAY_BUFFER, ebo));
ec(glDrawElementsInstanced(GL_TRIANGLES, triangleElementIndices.size(), GL_UNSIGNED_INT, reinterpret_cast<void*>(0), instanceCount));
}
//clear data for next frame
eid.clearFrameData();
}
}
ec(glBindVertexArray(0));//unbind VAO's
这个能见度有错吗?我已经使用 RenderDoc
进行了调试,当问题不存在时,事件浏览器中会出现绘图调用,如图所示:
但是当问题确实发生时,draw call 根本不会出现在 RenderDoc
中,如下图所示:
这对我来说似乎很奇怪。我已经通过调试器验证绘制调用正在执行。但它似乎默默地失败了。
我试过使用 nvidia nsight 进行调试,但在通过 nvidia nsight 启动时无法重现。
我已经验证
- 实例VBO缓冲区大小没有变化或增长过大,它的大小是稳定的
- 制服可以正确找到值
- vao 绑定似乎以正确的顺序发生
系统规格:windows10; Opengl3.3,8GB内存; i7-8700k, NVIDIA GeForce GTX TITAN X
在我的笔记本电脑上也观察到问题,再现率大致相同。它有一个英特尔图形芯片。
github link 到 actual source 如果有人试图编译让我知道,你需要用我制作的副本替换隐藏的 .suo 以自动填写 linker 设置。功能:ParticleSystem::handlePostRender
事实证明这不是实例化的问题。我实现了一个非实例版本并遇到了同样的问题。真正的问题是我的渲染系统。当前,交换缓冲区和渲染粒子正在侦听同一个委托(事件),偶尔交换缓冲区会在事件广播时首先出现。所以顺序是:
- 清屏
- 渲染场景
- 交换缓冲区
- 渲染粒子
- 清屏
- 渲染场景
- 交换缓冲区
- 渲染粒子
因此,粒子永远不可见,因为它们在本应是下一帧开始的位置立即被清除。
我一直在使用 OpenGL 开发项目。使用实例化绘制调用渲染粒子。
问题是有时 glDrawElementsInstanced 不会渲染任何东西。并且没有报错。其他模型和效果渲染良好。但是里面没有颗粒 我的粒子系统将渲染。绘图调用看起来像
ec(glBindVertexArray(vao));
ec(glBindBuffer(GL_ELEMENT_ARRAY_BUFFER, ebo));
ec(glDrawElementsInstanced(GL_TRIANGLES, triangleElementIndices.size(), GL_UNSIGNED_INT, reinterpret_cast<void*>(0), instanceCount));
ec
是一个用于 e
错误 c
heck opengl 的宏。它有效地做到了这一点:
while (GLenum error = glGetError()){
std::cerr << "OpenGLError:" << std::hex << error << " " << functionName << " " << file << " " << line << std::endl;
}
渲染粒子问题在发布模式下更为普遍,而不是在调试模式下;但在两种模式下都会发生。问题发生在发布模式下 8/10
和调试模式下 1/10
。
下面是粒子的渲染过程: 对于每个实例化的绘制调用...
- 绑定一个共享的顶点缓冲区对象(vbo)
- 将数据放入该顶点缓冲区对象 (vbo)
- 遍历许多顶点数组对象 (vao),将 VBO 与它们相关联并设置顶点属性
- 渲染每个 vao
所有对象共享同一个 VBO,但它们是按顺序呈现的。整个应用程序目前是单线程的,所以这应该不是问题。
粒子 A(两个 vaos)和粒子 B(一个 vao)的给定框架如下:
- -将 A 的数据缓冲到名为 VBO 的顶点缓冲区中
- -绑定A_vao1
- -设置A的实例顶点属性
- -绑定A_vao2
- -设置A的实例顶点属性
- -渲染A_vao1
- -渲染A_vao2
- -缓冲区 B 的数据进入顶点缓冲区名称 VBO(没有 glGenBuffers,这是同一个缓冲区)
- -绑定B_vao1
- -设置B的实例顶点属性
- -渲染B_vao1
这种方法有明显的问题吗?
下面的源代码已经过简化,但我保留了大部分相关部分。与我上面的不同,它实际上使用了 2 个共享顶点缓冲区对象 (VBO),一个用于 matrix4s,一个用于 vector4s。
GLuint instanceMat4VBO = ... //valid created vertex buffer objects
GLuint instanceVec4VBO = ... //valid created vertex buffer objects
//iterate over all the instnaces; data is stored in class EffectInstanceData
for(EffectInstanceData& eid : instancedEffectsData)
{
if (eid.numInstancesThisFrame > 0)
{
// ---- BUFFER data ---- before binding it to all VAOs (model's may have multiple meshes, each with their own VAO)
ec(glBindBuffer(GL_ARRAY_BUFFER, instanceMac4VBO)); //BUFFER MAT4 INSTANCE DATA
ec(glBufferData(GL_ARRAY_BUFFER, sizeof(glm::mat4) * eid.mat4Data.size(), &eid.mat4Data[0], GL_STATIC_DRAW));
ec(glBindBuffer(GL_ARRAY_BUFFER, instanceVec4VBO)); //BUFFER VEC4 INSTANCE DATA
ec(glBufferData(GL_ARRAY_BUFFER, sizeof(glm::vec4) * eid.vec4Data.size(), &eid.vec4Data[0], GL_STATIC_DRAW));
//meshes may have multiple VAO's that need rendering, set up buffers with instance data for each VAO before instance rendering is done
for (GLuint effectVAO : eid.effectData->mesh->getVAOs())
{
ec(glBindVertexArray(effectVAO));
{ //set up mat4 buffer
ec(glBindBuffer(GL_ARRAY_BUFFER, instanceMat4VBO));
GLsizei numVec4AttribsInBuffer = 4 * eid.numMat4PerInstance;
size_t packagedVec4Idx_matbuffer = 0;
//pass built-in data into instanced array vertex attribute
{
//mat4 (these take 4 separate vec4s)
{
//model matrix
ec(glEnableVertexAttribArray(8));
ec(glEnableVertexAttribArray(9));
ec(glEnableVertexAttribArray(10));
ec(glEnableVertexAttribArray(11));
ec(glVertexAttribPointer(8, 4, GL_FLOAT, GL_FALSE, numVec4AttribsInBuffer * sizeof(glm::vec4), reinterpret_cast<void*>(packagedVec4Idx_matbuffer++ * sizeof(glm::vec4))));
ec(glVertexAttribPointer(9, 4, GL_FLOAT, GL_FALSE, numVec4AttribsInBuffer * sizeof(glm::vec4), reinterpret_cast<void*>(packagedVec4Idx_matbuffer++ * sizeof(glm::vec4))));
ec(glVertexAttribPointer(10, 4, GL_FLOAT, GL_FALSE, numVec4AttribsInBuffer * sizeof(glm::vec4), reinterpret_cast<void*>(packagedVec4Idx_matbuffer++ * sizeof(glm::vec4))));
ec(glVertexAttribPointer(11, 4, GL_FLOAT, GL_FALSE, numVec4AttribsInBuffer * sizeof(glm::vec4), reinterpret_cast<void*>(packagedVec4Idx_matbuffer++ * sizeof(glm::vec4))));
ec(glVertexAttribDivisor(8, 1));
ec(glVertexAttribDivisor(9, 1));
ec(glVertexAttribDivisor(10, 1));
ec(glVertexAttribDivisor(11, 1));
}
}
}
{ //set up vec4 buffer
ec(glBindBuffer(GL_ARRAY_BUFFER, instanceVec4VBO));
GLsizei numVec4AttribsInBuffer = eid.numVec4PerInstance;
size_t packagedVec4Idx_v4buffer = 0;
{
//package built-in vec4s
ec(glEnableVertexAttribArray(7));
ec(glVertexAttribPointer(7, 4, GL_FLOAT, GL_FALSE, numVec4AttribsInBuffer * sizeof(glm::vec4), reinterpret_cast<void*>(packagedVec4Idx_v4buffer++ * sizeof(glm::vec4))));
ec(glVertexAttribDivisor(7, 1));
}
}
}
//activate shader
... code setting uniforms on shaders, does not appear to be issue...
//instanced render
for (GLuint vao : eid.effectData->mesh->getVAOs()) //this actually results in function calls to a mesh class instances, but effectively is doing this loop
{
ec(glBindVertexArray(vao));
ec(glBindBuffer(GL_ELEMENT_ARRAY_BUFFER, ebo));
ec(glDrawElementsInstanced(GL_TRIANGLES, triangleElementIndices.size(), GL_UNSIGNED_INT, reinterpret_cast<void*>(0), instanceCount));
}
//clear data for next frame
eid.clearFrameData();
}
}
ec(glBindVertexArray(0));//unbind VAO's
这个能见度有错吗?我已经使用 RenderDoc
进行了调试,当问题不存在时,事件浏览器中会出现绘图调用,如图所示:
但是当问题确实发生时,draw call 根本不会出现在 RenderDoc
中,如下图所示:
这对我来说似乎很奇怪。我已经通过调试器验证绘制调用正在执行。但它似乎默默地失败了。
我试过使用 nvidia nsight 进行调试,但在通过 nvidia nsight 启动时无法重现。
我已经验证
- 实例VBO缓冲区大小没有变化或增长过大,它的大小是稳定的
- 制服可以正确找到值
- vao 绑定似乎以正确的顺序发生
系统规格:windows10; Opengl3.3,8GB内存; i7-8700k, NVIDIA GeForce GTX TITAN X
在我的笔记本电脑上也观察到问题,再现率大致相同。它有一个英特尔图形芯片。
github link 到 actual source 如果有人试图编译让我知道,你需要用我制作的副本替换隐藏的 .suo 以自动填写 linker 设置。功能:ParticleSystem::handlePostRender
事实证明这不是实例化的问题。我实现了一个非实例版本并遇到了同样的问题。真正的问题是我的渲染系统。当前,交换缓冲区和渲染粒子正在侦听同一个委托(事件),偶尔交换缓冲区会在事件广播时首先出现。所以顺序是:
- 清屏
- 渲染场景
- 交换缓冲区
- 渲染粒子
- 清屏
- 渲染场景
- 交换缓冲区
- 渲染粒子
因此,粒子永远不可见,因为它们在本应是下一帧开始的位置立即被清除。