我应该在统一缓冲区或着色器存储缓冲区对象中使用 `vec3` 吗?
Should I ever use a `vec3` inside of a uniform buffer or shader storage buffer object?
vec3
类型是一个很好的类型。它只占用 3 个浮点数,而我的数据只需要 3 个浮点数。我想在 UBO and/or SSBO:
的结构中使用一个
layout(std140) uniform UBO
{
vec4 data1;
vec3 data2;
float data3;
};
layout(std430) buffer SSBO
{
vec4 data1;
vec3 data2;
float data3;
};
然后,在我的 C 或 C++ 代码中,我可以这样做来创建匹配的数据结构:
struct UBO
{
vector4 data1;
vector3 data2;
float data3;
};
struct SSBO
{
vector4 data1;
vector3 data2;
float data3;
};
这是个好主意吗?
不!永远不要这样做!
声明 UBOs/SSBOs 时,假设所有 3 元素向量类型 都不存在 。这包括具有 3 行的列优先矩阵或具有 3 列的行优先矩阵。假设唯一的类型是标量、2 和 4 元素向量(和矩阵)。如果你这样做,你会避免很多悲伤。
如果你想要一个vec3+一个float的效果,那么你应该手动打包:
layout(std140) uniform UBO
{
vec4 data1;
vec4 data2and3;
};
是的,您必须使用 data2and3.w
来获取另一个值。处理一下。
如果您想要 vec3
的数组,则将它们设为 vec4
的数组。使用 3 元素向量的矩阵也是如此。只需从 SSBOs/UBOs 中消除三元素向量的整个概念;长期 运行.
你会过得更好
你应该避免的原因有两个 vec3
:
它不会像 C/C++ 那样做
如果您使用 std140
布局,那么您可能希望在 C 或 C++ 中定义与 GLSL 中的定义相匹配的数据结构。这使得两者之间的混合和匹配变得容易。而 std140
布局至少可以在大多数情况下做到这一点。但是在 vec3
s.
时,它的布局规则与 C 和 C++ 编译器的通常布局规则不匹配
考虑以下 vec3
类型的 C++ 定义:
struct vec3a { float a[3]; };
struct vec3f { float x, y, z; };
这两个都是完全合法的类型。这些类型的 sizeof
和布局将匹配 std140
要求的大小和布局。但它与 std140
强加的对齐行为不匹配。
考虑一下:
//GLSL
layout(std140) uniform Block
{
vec3 a;
vec3 b;
} block;
//C++
struct Block_a
{
vec3a a;
vec3a b;
};
struct Block_f
{
vec3f a;
vec3f b;
};
在大多数 C++ 编译器上,Block_a
和 Block_f
的 sizeof
都为 24。这意味着 offsetof
b
将为 12。
然而,在 std140 布局中,vec3
总是与 4 个字对齐。因此,Block.b
的偏移量为 16。
现在,您可以尝试使用 C++11 的 alignas
功能(或 C11 的类似 _Alignas
功能)来修复该问题:
struct alignas(16) vec3a_16 { float a[3]; };
struct alignas(16) vec3f_16 { float x, y, z; };
struct Block_a
{
vec3a_16 a;
vec3a_16 b;
};
struct Block_f
{
vec3f_16 a;
vec3f_16 b;
};
如果编译器支持 16 字节对齐,这将起作用。或者至少,它适用于 Block_a
和 Block_f
.
的情况
但在这种情况下不会工作:
//GLSL
layout(std140) Block2
{
vec3 a;
float b;
} block2;
//C++
struct Block2_a
{
vec3a_16 a;
float b;
};
struct Block2_f
{
vec3f_16 a;
float b;
};
根据 std140
的规则,每个 vec3
必须 start 在 16 字节边界上。但是 vec3
不会 消耗 16 字节的存储空间;它只消耗 12。并且由于 float
可以从 4 字节边界开始,所以 vec3
后跟 float
将占用 16 个字节。
但是 C++ 对齐规则不允许这样的事情。如果一个类型与 X 字节边界对齐,那么使用该类型将消耗 X 字节的倍数。
因此匹配 std140
的布局需要您根据其使用的确切位置选择一种类型。如果它后面跟着一个float
,你必须使用vec3a
;如果它后面跟着某种超过 4 字节对齐的类型,则必须使用 vec3a_16
.
或者您可以不在着色器中使用 vec3
并避免所有这些增加的复杂性。
请注意,基于 alignas(8)
的 vec2
不会有此问题。 C/C++ 结构和数组也不会使用正确的对齐说明符(尽管较小类型的数组有其自身的问题)。此问题仅在使用裸vec3
时出现。
实现支持模糊
即使您做的一切都正确,但已知实施会错误地实施 vec3
的古怪布局规则。一些实现有效地将 C++ 对齐规则强加给 GLSL。因此,如果您使用 vec3
,它会像 C++ 对待 16 字节对齐类型一样对待它。在这些实现中,vec3
后跟 float
将像 vec4
后跟 float
.
一样工作
是的,这是实施者的错。但是由于您无法 修复 实现,因此您必须解决它。最合理的方法是完全避免 vec3
。
请注意,对于 Vulkan(和使用 SPIR-V 的 OpenGL),SDK 的 GLSL 编译器会正确执行此操作,因此您无需为此担心。
vec3
类型是一个很好的类型。它只占用 3 个浮点数,而我的数据只需要 3 个浮点数。我想在 UBO and/or SSBO:
layout(std140) uniform UBO
{
vec4 data1;
vec3 data2;
float data3;
};
layout(std430) buffer SSBO
{
vec4 data1;
vec3 data2;
float data3;
};
然后,在我的 C 或 C++ 代码中,我可以这样做来创建匹配的数据结构:
struct UBO
{
vector4 data1;
vector3 data2;
float data3;
};
struct SSBO
{
vector4 data1;
vector3 data2;
float data3;
};
这是个好主意吗?
不!永远不要这样做!
声明 UBOs/SSBOs 时,假设所有 3 元素向量类型 都不存在 。这包括具有 3 行的列优先矩阵或具有 3 列的行优先矩阵。假设唯一的类型是标量、2 和 4 元素向量(和矩阵)。如果你这样做,你会避免很多悲伤。
如果你想要一个vec3+一个float的效果,那么你应该手动打包:
layout(std140) uniform UBO
{
vec4 data1;
vec4 data2and3;
};
是的,您必须使用 data2and3.w
来获取另一个值。处理一下。
如果您想要 vec3
的数组,则将它们设为 vec4
的数组。使用 3 元素向量的矩阵也是如此。只需从 SSBOs/UBOs 中消除三元素向量的整个概念;长期 运行.
你应该避免的原因有两个 vec3
:
它不会像 C/C++ 那样做
如果您使用 std140
布局,那么您可能希望在 C 或 C++ 中定义与 GLSL 中的定义相匹配的数据结构。这使得两者之间的混合和匹配变得容易。而 std140
布局至少可以在大多数情况下做到这一点。但是在 vec3
s.
考虑以下 vec3
类型的 C++ 定义:
struct vec3a { float a[3]; };
struct vec3f { float x, y, z; };
这两个都是完全合法的类型。这些类型的 sizeof
和布局将匹配 std140
要求的大小和布局。但它与 std140
强加的对齐行为不匹配。
考虑一下:
//GLSL
layout(std140) uniform Block
{
vec3 a;
vec3 b;
} block;
//C++
struct Block_a
{
vec3a a;
vec3a b;
};
struct Block_f
{
vec3f a;
vec3f b;
};
在大多数 C++ 编译器上,Block_a
和 Block_f
的 sizeof
都为 24。这意味着 offsetof
b
将为 12。
然而,在 std140 布局中,vec3
总是与 4 个字对齐。因此,Block.b
的偏移量为 16。
现在,您可以尝试使用 C++11 的 alignas
功能(或 C11 的类似 _Alignas
功能)来修复该问题:
struct alignas(16) vec3a_16 { float a[3]; };
struct alignas(16) vec3f_16 { float x, y, z; };
struct Block_a
{
vec3a_16 a;
vec3a_16 b;
};
struct Block_f
{
vec3f_16 a;
vec3f_16 b;
};
如果编译器支持 16 字节对齐,这将起作用。或者至少,它适用于 Block_a
和 Block_f
.
但在这种情况下不会工作:
//GLSL
layout(std140) Block2
{
vec3 a;
float b;
} block2;
//C++
struct Block2_a
{
vec3a_16 a;
float b;
};
struct Block2_f
{
vec3f_16 a;
float b;
};
根据 std140
的规则,每个 vec3
必须 start 在 16 字节边界上。但是 vec3
不会 消耗 16 字节的存储空间;它只消耗 12。并且由于 float
可以从 4 字节边界开始,所以 vec3
后跟 float
将占用 16 个字节。
但是 C++ 对齐规则不允许这样的事情。如果一个类型与 X 字节边界对齐,那么使用该类型将消耗 X 字节的倍数。
因此匹配 std140
的布局需要您根据其使用的确切位置选择一种类型。如果它后面跟着一个float
,你必须使用vec3a
;如果它后面跟着某种超过 4 字节对齐的类型,则必须使用 vec3a_16
.
或者您可以不在着色器中使用 vec3
并避免所有这些增加的复杂性。
请注意,基于 alignas(8)
的 vec2
不会有此问题。 C/C++ 结构和数组也不会使用正确的对齐说明符(尽管较小类型的数组有其自身的问题)。此问题仅在使用裸vec3
时出现。
实现支持模糊
即使您做的一切都正确,但已知实施会错误地实施 vec3
的古怪布局规则。一些实现有效地将 C++ 对齐规则强加给 GLSL。因此,如果您使用 vec3
,它会像 C++ 对待 16 字节对齐类型一样对待它。在这些实现中,vec3
后跟 float
将像 vec4
后跟 float
.
是的,这是实施者的错。但是由于您无法 修复 实现,因此您必须解决它。最合理的方法是完全避免 vec3
。
请注意,对于 Vulkan(和使用 SPIR-V 的 OpenGL),SDK 的 GLSL 编译器会正确执行此操作,因此您无需为此担心。