Saxon:将 xdmNode 转换为 org.w3c.dom.Node
Saxon: convert xdmNode to org.w3c.dom.Node
我想将 xdmNode 转换为 dom 节点。我找到了以下部分解决方案:
Processor proc = new Processor(false);
XPathCompiler xpath = proc.newXPathCompiler();
Document doc = DocumentUtilities.createEventCountsTestDocument();
XdmNode xdmNode = proc.newDocumentBuilder().wrap(doc);
expression = "/caseFileModel/EventCount/EventCountEvents[EventCmmnId=\"_4cd9cdaabbd244548a32afcd4cf2e1c0\" and EventEventType=\"CREATE\"]/Timestamps/Date[last()]";
value = xpath.evaluate(expression, xdmNode);
XdmNode node = (XdmNode) value;
Node element = ((Node) node.getExternalNode());
System.out.println(element.getTextContent());
其中 createEventCountsTestDocument
根据以下内容生成文档 XML:
<caseFileModel>
</EventCountEvents>
<EventCountEvents>
<EventCmmnId>_8dbe1b3fa1a04787b2ef35d153d93ae5</EventCmmnId>
<EventEventType>CREATE</EventEventType>
<EventCount>1</EventCount>
<Timestamps>
<Date>2017-03-13T16:47:04Z</Date>
</Timestamps>
</EventCountEvents>
<EventCountEvents>
<EventCmmnId>_4cd9cdaabbd244548a32afcd4cf2e1c0</EventCmmnId>
<EventEventType>CREATE</EventEventType>
<EventCount>1</EventCount>
<Timestamps>
<Date>2017-03-13T16:47:04Z</Date>
</Timestamps>
</EventCountEvents>
</EventCount>
</caseFileModel>
我得到正确的输出即 2017-03-03T12:00:00Z
,但是 element
是 com.sun.org.apache.xerces.internal.dom.DeferredElementImpl
而不是 w3c.dom.Node
。这意味着当我调用 element.getNodeValue()
时它 returns null
。如果我调用 element.getFirstChild().getNodeValue()
,它会 return 得到正确的值 2017-03-03T12:00:00Z
。所以似乎有什么问题,但我找不到。我想找到一种方法将 xdmNode
转换为 w3c.dom.Node
而不是 DeferredElementImpl
.
这里有几点。恐怕这是一个相当复杂的故事。
Saxon 有两个表示节点的接口:高级接口 XdmNode
和低级接口 NodeInfo
。 XdmNode
始终是 NodeInfo
的包装器。
NodeInfo
有很多不同的实现。 Saxon 中有两个 "native" 实现,分别用于 TinyTree 和 LinkedTree 模型;还有封装外部节点模型的实现,包括 DOM、JDOM、DOM4J、XOM 和 AXIOM。
如果您开始使用的 XdmNode
是一个 NodeInfo
的包装器,它本身包装了一个 DOM Node
,那么您可以到达底层 DOM节点使用XdmNode.getExternalNode()
。这个方法的签名returns Object
:那是因为wrapped节点可能是DOM,也可能是JDOM,XOM什么的
以上段落描述了您目前正在做的事情。您不必担心结果是 com.sun.org.apache.xerces.internal.dom.DeferredElementImpl
的实例;这只是实现 org.w3c.dom.Node
接口的许多内部 classes 之一。
如果您开始使用的 XdmNode
不是 DOM Node
的包装器,那么您有两个选择:
您可以将底层 NodeInfo
包装在 NodeOverNodeInfo
class 的实例中,它呈现底层 [=] 的 DOM 视图11=]节点。然而,这是一个只读视图,因为 Saxon 节点(通常)是不可变的。
您可以将 Saxon 节点复制到 DOM 节点,最好使用身份转换来完成。
综上所述,您应该知道 Saxon 在处理 DOM 树时通常比处理其内部树模型时慢 5 倍。这主要是由于在 DOM.
中处理名称和命名空间的方式效率低下
此外,正如您所发现的,DOM 方法用于诸如 element.getNodeValue() 之类的事情并不总是如您所愿。就我个人而言,我像躲避瘟疫一样躲避 DOM。
我想将 xdmNode 转换为 dom 节点。我找到了以下部分解决方案:
Processor proc = new Processor(false);
XPathCompiler xpath = proc.newXPathCompiler();
Document doc = DocumentUtilities.createEventCountsTestDocument();
XdmNode xdmNode = proc.newDocumentBuilder().wrap(doc);
expression = "/caseFileModel/EventCount/EventCountEvents[EventCmmnId=\"_4cd9cdaabbd244548a32afcd4cf2e1c0\" and EventEventType=\"CREATE\"]/Timestamps/Date[last()]";
value = xpath.evaluate(expression, xdmNode);
XdmNode node = (XdmNode) value;
Node element = ((Node) node.getExternalNode());
System.out.println(element.getTextContent());
其中 createEventCountsTestDocument
根据以下内容生成文档 XML:
<caseFileModel>
</EventCountEvents>
<EventCountEvents>
<EventCmmnId>_8dbe1b3fa1a04787b2ef35d153d93ae5</EventCmmnId>
<EventEventType>CREATE</EventEventType>
<EventCount>1</EventCount>
<Timestamps>
<Date>2017-03-13T16:47:04Z</Date>
</Timestamps>
</EventCountEvents>
<EventCountEvents>
<EventCmmnId>_4cd9cdaabbd244548a32afcd4cf2e1c0</EventCmmnId>
<EventEventType>CREATE</EventEventType>
<EventCount>1</EventCount>
<Timestamps>
<Date>2017-03-13T16:47:04Z</Date>
</Timestamps>
</EventCountEvents>
</EventCount>
</caseFileModel>
我得到正确的输出即 2017-03-03T12:00:00Z
,但是 element
是 com.sun.org.apache.xerces.internal.dom.DeferredElementImpl
而不是 w3c.dom.Node
。这意味着当我调用 element.getNodeValue()
时它 returns null
。如果我调用 element.getFirstChild().getNodeValue()
,它会 return 得到正确的值 2017-03-03T12:00:00Z
。所以似乎有什么问题,但我找不到。我想找到一种方法将 xdmNode
转换为 w3c.dom.Node
而不是 DeferredElementImpl
.
这里有几点。恐怕这是一个相当复杂的故事。
Saxon 有两个表示节点的接口:高级接口 XdmNode
和低级接口 NodeInfo
。 XdmNode
始终是 NodeInfo
的包装器。
NodeInfo
有很多不同的实现。 Saxon 中有两个 "native" 实现,分别用于 TinyTree 和 LinkedTree 模型;还有封装外部节点模型的实现,包括 DOM、JDOM、DOM4J、XOM 和 AXIOM。
如果您开始使用的 XdmNode
是一个 NodeInfo
的包装器,它本身包装了一个 DOM Node
,那么您可以到达底层 DOM节点使用XdmNode.getExternalNode()
。这个方法的签名returns Object
:那是因为wrapped节点可能是DOM,也可能是JDOM,XOM什么的
以上段落描述了您目前正在做的事情。您不必担心结果是 com.sun.org.apache.xerces.internal.dom.DeferredElementImpl
的实例;这只是实现 org.w3c.dom.Node
接口的许多内部 classes 之一。
如果您开始使用的 XdmNode
不是 DOM Node
的包装器,那么您有两个选择:
您可以将底层
NodeInfo
包装在NodeOverNodeInfo
class 的实例中,它呈现底层 [=] 的 DOM 视图11=]节点。然而,这是一个只读视图,因为 Saxon 节点(通常)是不可变的。您可以将 Saxon 节点复制到 DOM 节点,最好使用身份转换来完成。
综上所述,您应该知道 Saxon 在处理 DOM 树时通常比处理其内部树模型时慢 5 倍。这主要是由于在 DOM.
中处理名称和命名空间的方式效率低下此外,正如您所发现的,DOM 方法用于诸如 element.getNodeValue() 之类的事情并不总是如您所愿。就我个人而言,我像躲避瘟疫一样躲避 DOM。