Saxon:将 xdmNode 转换为 org.w3c.dom.Node

Saxon: convert xdmNode to org.w3c.dom.Node

我想将 xdmNode 转换为 dom 节点。我找到了以下部分解决方案:

Processor proc = new Processor(false);
XPathCompiler xpath = proc.newXPathCompiler();
Document doc = DocumentUtilities.createEventCountsTestDocument();
XdmNode xdmNode = proc.newDocumentBuilder().wrap(doc);

expression = "/caseFileModel/EventCount/EventCountEvents[EventCmmnId=\"_4cd9cdaabbd244548a32afcd4cf2e1c0\" and EventEventType=\"CREATE\"]/Timestamps/Date[last()]";
value = xpath.evaluate(expression, xdmNode);
XdmNode node = (XdmNode) value;
Node element = ((Node) node.getExternalNode());
System.out.println(element.getTextContent());

其中 createEventCountsTestDocument 根据以下内容生成文档 XML:

<caseFileModel>
        </EventCountEvents>
        <EventCountEvents>
            <EventCmmnId>_8dbe1b3fa1a04787b2ef35d153d93ae5</EventCmmnId>
            <EventEventType>CREATE</EventEventType>
            <EventCount>1</EventCount>
            <Timestamps>
                <Date>2017-03-13T16:47:04Z</Date>
            </Timestamps>
        </EventCountEvents>
        <EventCountEvents>
            <EventCmmnId>_4cd9cdaabbd244548a32afcd4cf2e1c0</EventCmmnId>
            <EventEventType>CREATE</EventEventType>
            <EventCount>1</EventCount>
            <Timestamps>
                <Date>2017-03-13T16:47:04Z</Date>
            </Timestamps>
        </EventCountEvents>
    </EventCount>
</caseFileModel>

我得到正确的输出即 2017-03-03T12:00:00Z,但是 elementcom.sun.org.apache.xerces.internal.dom.DeferredElementImpl 而不是 w3c.dom.Node。这意味着当我调用 element.getNodeValue() 时它 returns null。如果我调用 element.getFirstChild().getNodeValue(),它会 return 得到正确的值 2017-03-03T12:00:00Z。所以似乎有什么问题,但我找不到。我想找到一种方法将 xdmNode 转换为 w3c.dom.Node 而不是 DeferredElementImpl.

这里有几点。恐怕这是一个相当复杂的故事。

Saxon 有两个表示节点的接口:高级接口 XdmNode 和低级接口 NodeInfoXdmNode 始终是 NodeInfo 的包装器。

NodeInfo 有很多不同的实现。 Saxon 中有两个 "native" 实现,分别用于 TinyTree 和 LinkedTree 模型;还有封装外部节点模型的实现,包括 DOM、JDOM、DOM4J、XOM 和 AXIOM。

如果您开始使用的 XdmNode 是一个 NodeInfo 的包装器,它本身包装了一个 DOM Node,那么您可以到达底层 DOM节点使用XdmNode.getExternalNode()。这个方法的签名returns Object:那是因为wrapped节点可能是DOM,也可能是JDOM,XOM什么的

以上段落描述了您目前正在做的事情。您不必担心结果是 com.sun.org.apache.xerces.internal.dom.DeferredElementImpl 的实例;这只是实现 org.w3c.dom.Node 接口的许多内部 classes 之一。

如果您开始使用的 XdmNode 不是 DOM Node 的包装器,那么您有两个选择:

  1. 您可以将底层 NodeInfo 包装在 NodeOverNodeInfo class 的实例中,它呈现底层 [=] 的 DOM 视图11=]节点。然而,这是一个只读视图,因为 Saxon 节点(通常)是不可变的。

  2. 您可以将 Saxon 节点复制到 DOM 节点,最好使用身份转换来完成。

综上所述,您应该知道 Saxon 在处理 DOM 树时通常比处理其内部树模型时慢 5 倍。这主要是由于在 DOM.

中处理名称和命名空间的方式效率低下

此外,正如您所发现的,DOM 方法用于诸如 element.getNodeValue() 之类的事情并不总是如您所愿。就我个人而言,我像躲避瘟疫一样躲避 DOM。