XML 文件的 ParserException 使用 VTD-XML
ParserException for XML file with ampersands using VTD-XML
我正在尝试使用 VTD-XML 解析来自 JMDict 项目的 JMDict_e.xml 文件。但是,我 运行 遇到了解析错误。
出现的唯一错误消息是:
ParserException: com.ximpleware.EntityException: Errors in Entity: Illegal entity char
xml 的简短摘录如下:
<entry>
<ent_seq>1279770</ent_seq>
<k_ele>
<keb>構成要素</keb>
</k_ele>
<r_ele>
<reb>こうせいようそ</reb>
</r_ele>
<sense>
<pos>&n;</pos>
<pos>&adj-no;</pos>
<field>∁</field>
<gloss>components</gloss>
<gloss>elements</gloss>
<gloss>parts</gloss>
</sense>
</entry>
我认为在 pos
字段中,非法字符很可能是 & 符号。有没有办法让 vtd-xml 不将这些符号视为特殊字符?或者是否有解决此问题的不同方法?
VTD-XML 只识别那些内置的字符实体。在我看来,大多数实体都是无效的。在将其提供给解析器之前,您可能需要解决这些问题。
我正在尝试使用 VTD-XML 解析来自 JMDict 项目的 JMDict_e.xml 文件。但是,我 运行 遇到了解析错误。
出现的唯一错误消息是:
ParserException: com.ximpleware.EntityException: Errors in Entity: Illegal entity char
xml 的简短摘录如下:
<entry>
<ent_seq>1279770</ent_seq>
<k_ele>
<keb>構成要素</keb>
</k_ele>
<r_ele>
<reb>こうせいようそ</reb>
</r_ele>
<sense>
<pos>&n;</pos>
<pos>&adj-no;</pos>
<field>∁</field>
<gloss>components</gloss>
<gloss>elements</gloss>
<gloss>parts</gloss>
</sense>
</entry>
我认为在 pos
字段中,非法字符很可能是 & 符号。有没有办法让 vtd-xml 不将这些符号视为特殊字符?或者是否有解决此问题的不同方法?
VTD-XML 只识别那些内置的字符实体。在我看来,大多数实体都是无效的。在将其提供给解析器之前,您可能需要解决这些问题。