使用 Python elementTree 模块在同一类别中查找 xml 标签的内容
Find the content of the xml tag in the same category as having another tag with Python elementTree module
我的 xml 文件如下所示:
<feed>
<doc>
<title>Main title</title>
<url>https://test.com</url>
<abstract>some text</abstract>
</doc>
<doc>
<title>Wikipedia</title>
<url>https://wikipedia.org</url>
<abstract>screenshot</abstract>
</doc>
</feed>
这是我的代码:
from xml.etree import ElementTree as et
import re
source = "simple.xml"
root = et.fromstring(source)
for child in root: # read abstract tags
title = child.find('title').text
result = child.find('abstract').text
print("{}: {}".format(title, result)
我想要这个输出:
Main title: some text
Wikipedia: screenshot
但是我无法获取标题标签内容...
现在我无法通过 et.fromstring(source)
获取 xml 文件内容
f='''<root><doc><title>Main title</title>
<url>https://test.com</url>
<abstract>some text</abstract>
</doc>
<doc>
<title>Wikipedia</title>
<url>https://wikipedia.org</url>
<abstract>screenshot</abstract>
</doc></root>'''
import xml.etree.ElementTree as ET
root = ET.fromstring(f)
for child in root:
title=child.find('title').text
abstract=child.find('abstract').text
print('{}: {}'.format(title,abstract))
输出:
Main title: some text
Wikipedia: screenshot
给出的xml被破坏了,所以我不得不添加一个root
来使它完整,如果你能粘贴正确的xml我可以修改代码。
我的 xml 文件如下所示:
<feed>
<doc>
<title>Main title</title>
<url>https://test.com</url>
<abstract>some text</abstract>
</doc>
<doc>
<title>Wikipedia</title>
<url>https://wikipedia.org</url>
<abstract>screenshot</abstract>
</doc>
</feed>
这是我的代码:
from xml.etree import ElementTree as et
import re
source = "simple.xml"
root = et.fromstring(source)
for child in root: # read abstract tags
title = child.find('title').text
result = child.find('abstract').text
print("{}: {}".format(title, result)
我想要这个输出:
Main title: some text Wikipedia: screenshot
但是我无法获取标题标签内容...
现在我无法通过 et.fromstring(source)
f='''<root><doc><title>Main title</title>
<url>https://test.com</url>
<abstract>some text</abstract>
</doc>
<doc>
<title>Wikipedia</title>
<url>https://wikipedia.org</url>
<abstract>screenshot</abstract>
</doc></root>'''
import xml.etree.ElementTree as ET
root = ET.fromstring(f)
for child in root:
title=child.find('title').text
abstract=child.find('abstract').text
print('{}: {}'.format(title,abstract))
输出:
Main title: some text
Wikipedia: screenshot
给出的xml被破坏了,所以我不得不添加一个root
来使它完整,如果你能粘贴正确的xml我可以修改代码。