使用 Python 从 XML 中提取 CDATA
Extract CDATA from XML with Python
我正在处理这样的文件 XML :
import xml.etree.ElementTree as ET
xml = '''
<root>
<a name='name1' label='label1'
<b>
<result para='1'
</b>
</a>
<name><![CDATA[<?xml version='1.0'?>
<name2><b a="" n="label1" x="32"/><b a="" n="label2" x="4"/></b></name2>]]></name>
</root>
'''
myroot = ET.fromstring(xml)
我想提取 CDATA 的内容,以便能够提取一些信息并将其作为字符串进行分析。
我还没找到办法。
有没有人这样做过?或者有人有什么想法可以帮助我吗?
提前致谢
首先,您的 xml 文件看起来格式不正确。一些标签没有关闭(a 和结果)。除此之外,您可以使用 .find 方法提取内容。
name_content = myroot.find('name').text
我正在处理这样的文件 XML :
import xml.etree.ElementTree as ET
xml = '''
<root>
<a name='name1' label='label1'
<b>
<result para='1'
</b>
</a>
<name><![CDATA[<?xml version='1.0'?>
<name2><b a="" n="label1" x="32"/><b a="" n="label2" x="4"/></b></name2>]]></name>
</root>
'''
myroot = ET.fromstring(xml)
我想提取 CDATA 的内容,以便能够提取一些信息并将其作为字符串进行分析。
我还没找到办法。 有没有人这样做过?或者有人有什么想法可以帮助我吗?
提前致谢
首先,您的 xml 文件看起来格式不正确。一些标签没有关闭(a 和结果)。除此之外,您可以使用 .find 方法提取内容。
name_content = myroot.find('name').text