检索元素的所有文本,包括 python 中的子元素
Retrieve all text of an element including its child in python
我写了一个代码来查找 xml 中特定标签中的文本。它适用于没有子标签的标签。
For e.g. 1 <a>ajsaka</a>. it works fine for this.
e.g. 2 But if there is an instance of <b>ahsjd<c>jjiij</c>aa</b>.
没用。我想要标签中的所有内容,包括其子元素文本。我希望它打印 ahsjdjjiijaa,但它只打印 ahsjd。到目前为止,这是我的代码。
这是输入文件。
<level>
<ex>
<nt>[edit <topic-ref link-text="short-title"
topic-id="13629">address</topic-ref>],</nt>
<nt>[edit routing-instances <var>routing-instance-name</var
> <topic-ref link-text="short-title" topic-id="13629">address-
assignment</topic-ref
>]</nt>
</ex>
<exam>
</exam>
</level>
from lxml import etree
doc=etree.parse('C:/xx/bb.xml')
root=doc.getroot()
node=root.find('level')
count=len(node.getchildren())
print (count)
for elem in root.findall('level/ex/nt'):
print (elem.text)
如何获取?
您可以将文件读取为字符串,然后连接标签之间的所有文本
import xml.etree.ElementTree as ET
text = open('C:/xx/bb.xml').read()
''.join(ET.fromstring(text).itertext())
输出:
'ahsjdjjiijaa'
我写了一个代码来查找 xml 中特定标签中的文本。它适用于没有子标签的标签。
For e.g. 1 <a>ajsaka</a>. it works fine for this.
e.g. 2 But if there is an instance of <b>ahsjd<c>jjiij</c>aa</b>.
没用。我想要标签中的所有内容,包括其子元素文本。我希望它打印 ahsjdjjiijaa,但它只打印 ahsjd。到目前为止,这是我的代码。
这是输入文件。
<level>
<ex>
<nt>[edit <topic-ref link-text="short-title"
topic-id="13629">address</topic-ref>],</nt>
<nt>[edit routing-instances <var>routing-instance-name</var
> <topic-ref link-text="short-title" topic-id="13629">address-
assignment</topic-ref
>]</nt>
</ex>
<exam>
</exam>
</level>
from lxml import etree
doc=etree.parse('C:/xx/bb.xml')
root=doc.getroot()
node=root.find('level')
count=len(node.getchildren())
print (count)
for elem in root.findall('level/ex/nt'):
print (elem.text)
如何获取?
您可以将文件读取为字符串,然后连接标签之间的所有文本
import xml.etree.ElementTree as ET
text = open('C:/xx/bb.xml').read()
''.join(ET.fromstring(text).itertext())
输出:
'ahsjdjjiijaa'