在 lxml 序列化期间恢复 CDATA
Restore CDATA during lxml serialization
我知道我可以在 XML 解析期间保留 CDATA 部分,使用以下内容:
from lxml import etree
parser = etree.XMLParser(strip_cdata=False)
root = etree.XML('<root><![CDATA[test]]></root>', parser)
但是,有没有一种简单的方法可以在序列化期间 "restore" CDATA 部分?
例如,通过指定标签名称列表...
比如我想转:
<CONFIG>
<BODY>This is a <message>.</BODY>
</CONFIG>
至:
<CONFIG>
<BODY><![CDATA[This is a <message>.]]></BODY>
</CONFIG>
只是告诉 BODY
应该包含 CDATA…
是这样的吗?
from lxml import etree
parser = etree.XMLParser(strip_cdata=True)
root = etree.XML('<root><x><![CDATA[<test>]]></x></root>', parser)
print etree.tostring(root)
for elem in root.findall('x'):
elem.text = etree.CDATA(elem.text)
print etree.tostring(root)
生产:
<root><x><test></x></root>
<root><x><![CDATA[<test>]]></x></root>
我知道我可以在 XML 解析期间保留 CDATA 部分,使用以下内容:
from lxml import etree
parser = etree.XMLParser(strip_cdata=False)
root = etree.XML('<root><![CDATA[test]]></root>', parser)
但是,有没有一种简单的方法可以在序列化期间 "restore" CDATA 部分? 例如,通过指定标签名称列表...
比如我想转:
<CONFIG>
<BODY>This is a <message>.</BODY>
</CONFIG>
至:
<CONFIG>
<BODY><![CDATA[This is a <message>.]]></BODY>
</CONFIG>
只是告诉 BODY
应该包含 CDATA…
是这样的吗?
from lxml import etree
parser = etree.XMLParser(strip_cdata=True)
root = etree.XML('<root><x><![CDATA[<test>]]></x></root>', parser)
print etree.tostring(root)
for elem in root.findall('x'):
elem.text = etree.CDATA(elem.text)
print etree.tostring(root)
生产:
<root><x><test></x></root>
<root><x><![CDATA[<test>]]></x></root>