如何解析具有由冒号和换行符分隔的键和值的 XML 元素?
How to parse an XML element which has keys and values separated by colons and newlines?
我目前正在进行一个项目,我必须从大量 XML 文档中获取信息。每个文档都有一个元素 header_text。里面有很多值,看起来像这样:
<header_text>
key1: val1
key2: val2
key3: val3
</header_text>
每个文档中的键都相同,值有时为空。
我有一种强烈的感觉,这不标准 XML,但我可能错了?
有谁知道如何快速简单地解析这些值?
谢谢!
编辑:我在 python
也许你可以使用python和elementTree模块来解析它:
https://docs.python.org/3.4/library/xml.etree.elementtree.html#tutorial
我目前正在进行一个项目,我必须从大量 XML 文档中获取信息。每个文档都有一个元素 header_text。里面有很多值,看起来像这样:
<header_text>
key1: val1
key2: val2
key3: val3
</header_text>
每个文档中的键都相同,值有时为空。 我有一种强烈的感觉,这不标准 XML,但我可能错了? 有谁知道如何快速简单地解析这些值?
谢谢!
编辑:我在 python
也许你可以使用python和elementTree模块来解析它: https://docs.python.org/3.4/library/xml.etree.elementtree.html#tutorial