Alignment/Packing 在 Python Struct.Unpack
Alignment/Packing in Python Struct.Unpack
我有一个硬件发送固定长度的数据:2bytes,1bytes,4bytes,4bytes,2bytes,4bytes,共17bytes。如果我将格式更改为 18 字节,代码可以工作,但值不正确。
format = '<2s1s4s4s2s4s'
print(struct.calcsize(format))
print(len(hardware_data))
splitdata = struct.unpack(format,hardware_data)
输出为 17、18 并且由于不匹配而出错。我认为这是由对齐引起的,但我不确定,而且我尝试过的任何方法都无法解决这个问题。下面是几个典型的字符串,如果我 print(hardware_data)
我注意到 'R' 和 'n' 字符,但我不确定如何处理。
b'\x18\x06\x00R\x1f\x01\x00\x00\x00\x00\x00\xd8\xff\x00\x00\x00\x00\x80'
b'\x18\x06\x00R\x1f\x01\x00\x00\x00\x00\x00\n\x00\x00\x00\x00\x00\x80'
很可能发送数据的任何方式都以您意想不到的方式填充数据。
例如,如果第一个四字节字段应该表示一个 int
,C 结构填充规则将需要一个填充字节,在一个字节字段之后(将下一个四字节字段对齐到四个字节对齐)。所以只需显式添加填充字节,将格式字符串更改为:
format = '<2s1sx4s4s2s4s'
那里的 x
说 "I expect a byte here, but it's padding, don't unpack it to anything." 填充字节可能属于其他地方(我不知道你的硬件在做什么);我注意到第三个字节在两个示例中都是 NUL ([=14=]
) 字节,但我假设填充的位置是 'R'
,所以您可能想要:
format = '<2sx1s4s4s2s4s'
代替。或者它可能在其他地方(不知道哪些字段是硬件结构中的 char
数组,哪些是具有对齐要求的较大类型,这是不可能的)。重点是,您的硬件正在发送 18 个字节;找出哪个是垃圾,然后将 x
填充字节放在适当的位置。
旁注:repr
of bytes
对象将使用 ASCII 或更简单的 ASCII 转义(如果可用)。这就是您在输出中看到 R
和 \n
的原因; b'R'
和 b'\x52'
是等效的文字,b'\n'
和 b'\x0a'
和 Python 选择使用 "more readable" 版本(当 bytes
实际上只是 ASCII,这 更 更具可读性)。
我有一个硬件发送固定长度的数据:2bytes,1bytes,4bytes,4bytes,2bytes,4bytes,共17bytes。如果我将格式更改为 18 字节,代码可以工作,但值不正确。
format = '<2s1s4s4s2s4s'
print(struct.calcsize(format))
print(len(hardware_data))
splitdata = struct.unpack(format,hardware_data)
输出为 17、18 并且由于不匹配而出错。我认为这是由对齐引起的,但我不确定,而且我尝试过的任何方法都无法解决这个问题。下面是几个典型的字符串,如果我 print(hardware_data)
我注意到 'R' 和 'n' 字符,但我不确定如何处理。
b'\x18\x06\x00R\x1f\x01\x00\x00\x00\x00\x00\xd8\xff\x00\x00\x00\x00\x80'
b'\x18\x06\x00R\x1f\x01\x00\x00\x00\x00\x00\n\x00\x00\x00\x00\x00\x80'
很可能发送数据的任何方式都以您意想不到的方式填充数据。
例如,如果第一个四字节字段应该表示一个 int
,C 结构填充规则将需要一个填充字节,在一个字节字段之后(将下一个四字节字段对齐到四个字节对齐)。所以只需显式添加填充字节,将格式字符串更改为:
format = '<2s1sx4s4s2s4s'
那里的 x
说 "I expect a byte here, but it's padding, don't unpack it to anything." 填充字节可能属于其他地方(我不知道你的硬件在做什么);我注意到第三个字节在两个示例中都是 NUL ([=14=]
) 字节,但我假设填充的位置是 'R'
,所以您可能想要:
format = '<2sx1s4s4s2s4s'
代替。或者它可能在其他地方(不知道哪些字段是硬件结构中的 char
数组,哪些是具有对齐要求的较大类型,这是不可能的)。重点是,您的硬件正在发送 18 个字节;找出哪个是垃圾,然后将 x
填充字节放在适当的位置。
旁注:repr
of bytes
对象将使用 ASCII 或更简单的 ASCII 转义(如果可用)。这就是您在输出中看到 R
和 \n
的原因; b'R'
和 b'\x52'
是等效的文字,b'\n'
和 b'\x0a'
和 Python 选择使用 "more readable" 版本(当 bytes
实际上只是 ASCII,这 更 更具可读性)。