iOS 金属缓冲器不遵守步幅值
iOS Metal buffer not honouring stride value
我有一个每个实例的统一缓冲区,其中缓冲区中的每个元素都是 64 字节,但我只使用顶点着色器中每个元素的前 16 字节 (float3)。我大步向前来描述这一点。问题是它不会跨过其他 48 个字节 除非 我在着色器中向结构添加填充,以便它也是 64 个字节。
// Particle Instance Position
vertexDescriptor.attributes[2].format = .Float3 // 16 bytes with padding.
vertexDescriptor.attributes[2].offset = 0
vertexDescriptor.attributes[2].bufferIndex = 2
vertexDescriptor.layouts[2].stride = strideof(Particle)
vertexDescriptor.layouts[2].stepFunction = .PerInstance
...
commandEncoder.setVertexBuffer(instanceUniformBuffer, offset:0, atIndex:2)
应用端粒子结构:
struct Particle {
var position = float3()
var prevPos = float3()
var attractPoint = float3()
var ref: DataRef!
var state = State.Free
enum State: Int {
case Free = 0
case Active
}
}
这里是对应的Metal结构,即Particle.position
对应着色器中的InstanceUniforms.instanceTranslate
。我希望上面的步幅设置意味着它为每个实例加载 Particle.position
并且跳过缓冲区中每个 Particle
的其他 48 个字节。
struct InstanceUniforms
{
float3 instanceTranslate [[ attribute(2) ]];
};
一些健全性检查,一切都有意义:
sizeof(float3) 16
alignof(float3) 16
sizeof(Particle) 57
alignof(Particle) 16
strideof(Particle) 64
但它不起作用,除非我将着色器结构填充到 64 字节:
struct InstanceUniforms
{
float3 instanceTranslate [[ attribute(2) ]];
float4 pad[3];
};
否则,对于第二个实例,着色器实际上将 instanceTranslate
设置为缓冲区中 第一个 元素的 Particle.prevPos
,就像它只跨过InstanceUniforms
结构的大小,无论在顶点描述符中设置的步幅如何。
我确定我这里一定是做错了什么,看来您不需要填充着色器结构。
所以看起来这就是使用金属缓冲区的 Just The Way It Is™:您必须填充着色器结构以匹配应用程序结构的步幅。我认为 Metal 着色器运行时从缓冲区加载 stride
字节并投射第一个 sizeof(MyShaderStruct)
并不困难 个。或者在附加管道状态时自动填充结构。但这些便利可能会影响效率。
这是我的 Swift / Shader 结构现在的样子以供参考:
金属:
struct Particle
{
float3 position;
float3 prevPos;
float4 color;
float4 lineColor;
float scale;
char pad[60];
};
Swift:
struct Particle {
var position = float3()
var prevPos = float3()
var color = float4()
var lineColor = float4()
var scale:Float = 0
var gravity = float3()
var data: DataRef!
weak var physics: Physics? = nil
var state = State.Free
enum State: Int {
case Free = 0
case Active
}
}
sizeof(Particle) 113
alignof(Particle) 16
strideof(Particle) 128
我有一个每个实例的统一缓冲区,其中缓冲区中的每个元素都是 64 字节,但我只使用顶点着色器中每个元素的前 16 字节 (float3)。我大步向前来描述这一点。问题是它不会跨过其他 48 个字节 除非 我在着色器中向结构添加填充,以便它也是 64 个字节。
// Particle Instance Position
vertexDescriptor.attributes[2].format = .Float3 // 16 bytes with padding.
vertexDescriptor.attributes[2].offset = 0
vertexDescriptor.attributes[2].bufferIndex = 2
vertexDescriptor.layouts[2].stride = strideof(Particle)
vertexDescriptor.layouts[2].stepFunction = .PerInstance
...
commandEncoder.setVertexBuffer(instanceUniformBuffer, offset:0, atIndex:2)
应用端粒子结构:
struct Particle {
var position = float3()
var prevPos = float3()
var attractPoint = float3()
var ref: DataRef!
var state = State.Free
enum State: Int {
case Free = 0
case Active
}
}
这里是对应的Metal结构,即Particle.position
对应着色器中的InstanceUniforms.instanceTranslate
。我希望上面的步幅设置意味着它为每个实例加载 Particle.position
并且跳过缓冲区中每个 Particle
的其他 48 个字节。
struct InstanceUniforms
{
float3 instanceTranslate [[ attribute(2) ]];
};
一些健全性检查,一切都有意义:
sizeof(float3) 16
alignof(float3) 16
sizeof(Particle) 57
alignof(Particle) 16
strideof(Particle) 64
但它不起作用,除非我将着色器结构填充到 64 字节:
struct InstanceUniforms
{
float3 instanceTranslate [[ attribute(2) ]];
float4 pad[3];
};
否则,对于第二个实例,着色器实际上将 instanceTranslate
设置为缓冲区中 第一个 元素的 Particle.prevPos
,就像它只跨过InstanceUniforms
结构的大小,无论在顶点描述符中设置的步幅如何。
我确定我这里一定是做错了什么,看来您不需要填充着色器结构。
所以看起来这就是使用金属缓冲区的 Just The Way It Is™:您必须填充着色器结构以匹配应用程序结构的步幅。我认为 Metal 着色器运行时从缓冲区加载 stride
字节并投射第一个 sizeof(MyShaderStruct)
并不困难 个。或者在附加管道状态时自动填充结构。但这些便利可能会影响效率。
这是我的 Swift / Shader 结构现在的样子以供参考:
金属:
struct Particle
{
float3 position;
float3 prevPos;
float4 color;
float4 lineColor;
float scale;
char pad[60];
};
Swift:
struct Particle {
var position = float3()
var prevPos = float3()
var color = float4()
var lineColor = float4()
var scale:Float = 0
var gravity = float3()
var data: DataRef!
weak var physics: Physics? = nil
var state = State.Free
enum State: Int {
case Free = 0
case Active
}
}
sizeof(Particle) 113
alignof(Particle) 16
strideof(Particle) 128