需要帮助解压缩存储在 Aztec 条形码中的 zlib 数据（德国铁路票）

Question

前提

我正在尝试从 Deutsche Bahn（德国铁路）发行的车票上当前使用的条形码格式中解码数据。我找到了这个 very useful website (german) that already does a similar thing and offers a python script.

该网站声明数据是使用 zlib 压缩的，生成的 blob 使用 DSA 签名，并且全部存储在条形码（Aztec 格式）中。 Example of such a barcode

问题

我已经使用网站上提供的脚本成功解码了一张票。安装了 python-pyasn1 库。读取条形码（按照说明使用 BCTester，使用 NeoReader 应用程序时遇到一些问题）并将结果转换为十六进制。将十六进制数据保存为纯文本文件（由于某些原因脚本需要）并使用脚本解析文件。成功了。

但是脚本做的太多了。我想自己进行解析，但我无法使 zlib 解压缩工作，而且我对理解它的代码知之甚少。我几乎不知道Python。不过我有一些编程经验。

如果你只看条形码中的数据，它看起来像这样： https://gist.github.com/oelna/096787dc18596aaa4f5f

第一个问题是： 什么是 DSA 签名，我需要先将其从实际压缩数据中分离出来吗？

第二个： 一个简单的 python 脚本会是什么样子，它从文件中读取条形码 blob 并简单地解压缩它，以便我可以进一步解析格式。我想到了

#!/usr/bin python

import zlib

ticket = open('ticketdata.txt').read()

print zlib.decompress(ticket)

但它不起作用。任何正确方向的提示都将不胜感激。

这是保存到文件后脚本可读的十六进制数据：

23 55 54 30 31 30 30 38 30 30 30 30 30 31 30 2c 02 14 1c 3d e9 2d cd 5e c4 c0 56 bd ae 61 3e 54 ad a1 b3 26 33 d2 02 14 40 75 03 d0 cf 9c c1 f5 70 58 bd 59 50 a7 af c5 eb 0a f4 74 00 00 00 00 30 32 37 31 78 9c 65 50 cb 4e c3 30 10 e4 53 2c 71 43 4a d9 f5 2b 36 b7 84 04 52 01 55 51 40 1c 51 01 23 2a 42 0e 21 15 3f c7 8d 1f 63 36 11 52 2b 7c f1 78 76 76 66 bd f7 8f 4d 5d 54 c4 44 ce 10 05 d2 eb 78 5b ac 32 7b b4 77 c8 11 6b 62 c7 d6 79 aa ea aa 16 e1 b2 22 4d c4 01 ad 36 58 61 ca 6b 30 c6 e5 64 a0 b6 97 0f a6 a9 6f d6 71 df c7 cf 3e 7f 37 93 66 8e c6 71 de 92 4c c0 e1 22 0d fd 57 7a cb ee b6 cf ef 69 54 fd 66 44 05 31 d0 03 18 01 05 40 04 70 9c 51 46 ad 38 49 33 00 86 20 dd 42 88 04 22 5f a6 a1 db f6 78 79 d4 79 95 76 1f 3f df fd e7 98 86 16 b1 30 0b 65 d6 3c bd 2a 15 ce d8 ab e5 79 9d 47 7b da 34 13 c7 34 73 5a 6b 0b 35 72 d9 5c 0d bb ae 53 aa e8 5f 86 b4 01 e9 25 8d 0d 50 8e 72 3c 39 3c b2 13 94 82 74 ce 2d c7 b3 41 8b ed 4c 9f f5 0b e2 85 6c 01 8c fe c7 b8 e9 87 8c d9 f1 90 28 a3 73 fe 05 6d de 5f f1

Update/Solution:

Mark Adler 的建议让我走上了正确的道路。我花了几个小时，但我针对这个特定问题找到了一个可行的解决方案。如果我聪明一点，我会认出偏移量 68 处的 zlib header 78 9C。只需在此处拆分数据，后半部分就可以毫无怨言地解压。被警告，很伤心python

dsa_signature = ''
zlib_data = ''
cursor = 0

with open('ticketdata.txt', "rb") as fp:
    chunk = fp.read(1)
    while chunk:
        if(cursor < 68):
            dsa_signature += chunk
        else:
            zlib_data += chunk

        chunk = fp.read(1)
        cursor = cursor + 1


print "\nSignature:"
print "%s\n" % dsa_signature
print "\nCompressed data:"
print "%s\n" % zlib_data
print "\nDecoded:"
print zlib.decompress(zlib_data)

如果有解决这个问题的简单方法，请随时发表评论。我将继续为此做更多的工作，并尝试使其成为一个更强大的解决方案，主动寻找 zlib header，而不对偏移量进行硬编码。前半部分是标识符代码，如 #UT010080000060,，然后是 ASN.1 DSA 签名，幸运的是我不需要验证或修改。

Answer 1

有一个完整且有效的 zlib 流，从您的十六进制数据中的偏移量 68 开始，一直到结尾。解压为：

U_HEAD01005300802P9QAN-4��0501201514560DEDE0080ID0200180104840080BL020357031204GW3HEMP9��06012015060120151021193517S0010018Fernweh-Ticket natS00200012S0030001AS00900051-0-0S01200010S0140002S2S0150006BerlinS0160011NeumünsterS0210038B-Hbf 8:16 ICE794/HH-Hbf 10:16 IC2224S0230013Krull AndreaS026000213S0270019***************0484S0280013Andrea#Krull S031001006.01.2015S032001006.01.2015S035000511160S0360003271

如果您删除示例的前 68 个字节，zlib.decompress() 将 return 以上内容。

前 68 个字节是什么，由您来决定。

需要帮助解压缩存储在 Aztec 条形码中的 zlib 数据（德国铁路票）

Need help decompressing zlib data stored in Aztec barcode (Deutsche Bahn Ticket)

python

parsing

zlib

barcode

aztec-barcode

前提

问题

Update/Solution: