将 XML 转换为 CSV 文件
Convert XML to CSV file
我有一个这样的 XML 文件:
<hierachy>
<att>
<Order>1</Order>
<attval>Data</attval>
<children>
<att>
<Order>1</Order>
<attval>Studyval</attval>
</att>
<att>
<Order>2</Order>
<attval>Site</attval>
</att>
</children>
</att>
<att>
<Order>2</Order>
<attval>Info</attval>
<children>
<att>
<Order>1</Order>
<attval>age</attval>
</att>
<att>
<Order>2</Order>
<attval>gender</attval>
</att>
</children>
</att>
</hierachy>
我正在尝试将其转换为 CSV 文件,如下所示:
Data,Studyval
Date,Site
Info,age
Info,gender
我的问题是,父子名称都相同 - 'att'
和 'attval'
。我如何告诉 Python 区分它们并给我输出?
我试过这个:
import xml.etree.cElementTree as ET
tree = ET.parse('input.xml')
rebase = tree.getroot()
list = []
for att in rebase.findall('att'):
name = att.find('attval').text
for each_att in att.findall('attval'):
try:
val = att.find('attval').text
print name, val
except AttributeError:
print name
它打印了两次同样的东西。
不要使用findall
函数,因为它会在整棵树中寻找att标签。只需按从上到下的顺序遍历树并获取其中的相关元素即可。
from xml.etree import ElementTree
tree = ElementTree.parse('input.xml')
root = tree.getroot()
for att in root:
first = att.find('attval').text
for subatt in att.find('children'):
second = subatt.find('attval').text
print('{},{}'.format(first, second))
给出:
$ python process.py
Data,Studyval
Data,Site
Info,age
Info,gender
我有一个这样的 XML 文件:
<hierachy>
<att>
<Order>1</Order>
<attval>Data</attval>
<children>
<att>
<Order>1</Order>
<attval>Studyval</attval>
</att>
<att>
<Order>2</Order>
<attval>Site</attval>
</att>
</children>
</att>
<att>
<Order>2</Order>
<attval>Info</attval>
<children>
<att>
<Order>1</Order>
<attval>age</attval>
</att>
<att>
<Order>2</Order>
<attval>gender</attval>
</att>
</children>
</att>
</hierachy>
我正在尝试将其转换为 CSV 文件,如下所示:
Data,Studyval
Date,Site
Info,age
Info,gender
我的问题是,父子名称都相同 - 'att'
和 'attval'
。我如何告诉 Python 区分它们并给我输出?
我试过这个:
import xml.etree.cElementTree as ET
tree = ET.parse('input.xml')
rebase = tree.getroot()
list = []
for att in rebase.findall('att'):
name = att.find('attval').text
for each_att in att.findall('attval'):
try:
val = att.find('attval').text
print name, val
except AttributeError:
print name
它打印了两次同样的东西。
不要使用findall
函数,因为它会在整棵树中寻找att标签。只需按从上到下的顺序遍历树并获取其中的相关元素即可。
from xml.etree import ElementTree
tree = ElementTree.parse('input.xml')
root = tree.getroot()
for att in root:
first = att.find('attval').text
for subatt in att.find('children'):
second = subatt.find('attval').text
print('{},{}'.format(first, second))
给出:
$ python process.py
Data,Studyval
Data,Site
Info,age
Info,gender