lxml.objectify 和前导零
lxml.objectify and leading zeros
当在控制台上打印 objectify 元素时,前导零丢失,但它保留在 .text
:
>>> from lxml import objectify
>>>
>>> xml = "<a><b>01</b></a>"
>>> a = objectify.fromstring(xml)
>>> print(a.b)
1
>>> print(a.b.text)
01
据我了解,objectify
自动使 b
元素成为 IntElement
class 实例。但是,即使我尝试使用 XSD schema:
显式设置类型,它也会这样做
from io import StringIO
from lxml import etree, objectify
f = StringIO('''
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
<xsd:element name="a" type="AType"/>
<xsd:complexType name="AType">
<xsd:sequence>
<xsd:element name="b" type="xsd:string" />
</xsd:sequence>
</xsd:complexType>
</xsd:schema>
''')
schema = etree.XMLSchema(file=f)
parser = objectify.makeparser(schema=schema)
xml = "<a><b>01</b></a>"
a = objectify.fromstring(xml, parser)
print(a.b)
print(type(a.b))
print(a.b.text)
打印:
1
<class 'lxml.objectify.IntElement'>
01
如何强制 objectify
将此 b
元素识别为字符串元素?
根据文档和观察到的行为,XSD Schema
似乎仅用于 验证 ,但不参与确定 属性 任何数据类型。
例如,当一个元素在 XSD 中被声明为 integer
类型,但 XML 中的实际元素的值为 x01
,正确引发元素无效异常:
f = StringIO(u'''
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
<xsd:element name="a" type="AType"/>
<xsd:complexType name="AType">
<xsd:sequence>
<xsd:element name="b" type="xsd:integer" />
</xsd:sequence>
</xsd:complexType>
</xsd:schema>
''')
schema = etree.XMLSchema(file=f)
parser = objectify.makeparser(schema=schema)
xml = '''<a><b>x01</b></a>'''
a = objectify.fromstring(xml, parser)
# the following exception raised:
# lxml.etree.XMLSyntaxError: Element 'b': 'x01' is not a valid value of....
# ...the atomic type 'xs:integer'.
尽管 objectify
关于 how data types are matched 的文档提到了 XML 架构 xsi:type(链接部分中的第 4 条) ,那里的示例代码表明它意味着 通过直接在实际的 XML 元素 中添加 xsi:type
属性,而不是通过单独的 XSD 文件,因为示例:
xml = '''
<a xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<b xsi:type="string">01</b>
</a>
'''
a = objectify.fromstring(xml)
print(a.b) # 01
print(type(a.b)) # <type 'lxml.objectify.StringElement'>
print(a.b.text) # 01
当在控制台上打印 objectify 元素时,前导零丢失,但它保留在 .text
:
>>> from lxml import objectify
>>>
>>> xml = "<a><b>01</b></a>"
>>> a = objectify.fromstring(xml)
>>> print(a.b)
1
>>> print(a.b.text)
01
据我了解,objectify
自动使 b
元素成为 IntElement
class 实例。但是,即使我尝试使用 XSD schema:
from io import StringIO
from lxml import etree, objectify
f = StringIO('''
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
<xsd:element name="a" type="AType"/>
<xsd:complexType name="AType">
<xsd:sequence>
<xsd:element name="b" type="xsd:string" />
</xsd:sequence>
</xsd:complexType>
</xsd:schema>
''')
schema = etree.XMLSchema(file=f)
parser = objectify.makeparser(schema=schema)
xml = "<a><b>01</b></a>"
a = objectify.fromstring(xml, parser)
print(a.b)
print(type(a.b))
print(a.b.text)
打印:
1
<class 'lxml.objectify.IntElement'>
01
如何强制 objectify
将此 b
元素识别为字符串元素?
根据文档和观察到的行为,XSD Schema
似乎仅用于 验证 ,但不参与确定 属性 任何数据类型。
例如,当一个元素在 XSD 中被声明为 integer
类型,但 XML 中的实际元素的值为 x01
,正确引发元素无效异常:
f = StringIO(u'''
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
<xsd:element name="a" type="AType"/>
<xsd:complexType name="AType">
<xsd:sequence>
<xsd:element name="b" type="xsd:integer" />
</xsd:sequence>
</xsd:complexType>
</xsd:schema>
''')
schema = etree.XMLSchema(file=f)
parser = objectify.makeparser(schema=schema)
xml = '''<a><b>x01</b></a>'''
a = objectify.fromstring(xml, parser)
# the following exception raised:
# lxml.etree.XMLSyntaxError: Element 'b': 'x01' is not a valid value of....
# ...the atomic type 'xs:integer'.
尽管 objectify
关于 how data types are matched 的文档提到了 XML 架构 xsi:type(链接部分中的第 4 条) ,那里的示例代码表明它意味着 通过直接在实际的 XML 元素 中添加 xsi:type
属性,而不是通过单独的 XSD 文件,因为示例:
xml = '''
<a xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<b xsi:type="string">01</b>
</a>
'''
a = objectify.fromstring(xml)
print(a.b) # 01
print(type(a.b)) # <type 'lxml.objectify.StringElement'>
print(a.b.text) # 01