vtd-xml 的编码问题
Encoding issues with vtd-xml
我在使用 vtd-xml 库(版本 2.11)时遇到编码问题。
@Test
public void test() throws Exception {
final String originalXML = "<?xml version=\"1.0\"?>\r\n" + "<test>\r\n" + "öäüß\r\n" + "</test>\r\n" + "";
final VTDGen vg;
final XMLModifier xm;
final AutoPilot ap;
final VTDNav vn;
vg = new VTDGen();
// vg.setDoc(originalXML.getBytes()); --> results in
// com.ximpleware.ParseException: UTF 8 encoding error: should never happen
vg.setDoc(originalXML.getBytes("UTF-8"));
vg.parse(false);
ap = new AutoPilot();
xm = new XMLModifier();
vn = vg.getNav();
ap.bind(vn);
xm.bind(vn);
final XMLByteOutputStream xms = new XMLByteOutputStream(xm.getUpdatedDocumentSize());
xm.output(xms);
xms.close();
assertEquals(originalXML, xms.toString());
}
此断言语句失败
java.lang.AssertionError: expected:<<?xml version="1.0"?>
<test>
öäüß
</test>
> but was:<<?xml version="1.0"?>
<test>
ᅢ쌔내태゚
</test>
知道如何解决这个问题吗?
谢谢,保罗
我建议使用 ByteArrayOutputStream 而不是 XMLByteOutputStream。在这种情况下,您可以在从输出流构建字符串时提供字符集名称:
try (ByteArrayOutputStream os = new ByteArrayOutputStream()) {
xm.output(os);
assertEquals(originalXML, os.toString("UTF-8"));
}
在那种情况下,应保留特殊字符。
我在使用 vtd-xml 库(版本 2.11)时遇到编码问题。
@Test
public void test() throws Exception {
final String originalXML = "<?xml version=\"1.0\"?>\r\n" + "<test>\r\n" + "öäüß\r\n" + "</test>\r\n" + "";
final VTDGen vg;
final XMLModifier xm;
final AutoPilot ap;
final VTDNav vn;
vg = new VTDGen();
// vg.setDoc(originalXML.getBytes()); --> results in
// com.ximpleware.ParseException: UTF 8 encoding error: should never happen
vg.setDoc(originalXML.getBytes("UTF-8"));
vg.parse(false);
ap = new AutoPilot();
xm = new XMLModifier();
vn = vg.getNav();
ap.bind(vn);
xm.bind(vn);
final XMLByteOutputStream xms = new XMLByteOutputStream(xm.getUpdatedDocumentSize());
xm.output(xms);
xms.close();
assertEquals(originalXML, xms.toString());
}
此断言语句失败
java.lang.AssertionError: expected:<<?xml version="1.0"?> <test> öäüß </test> > but was:<<?xml version="1.0"?> <test> ᅢ쌔내태゚ </test>
知道如何解决这个问题吗?
谢谢,保罗
我建议使用 ByteArrayOutputStream 而不是 XMLByteOutputStream。在这种情况下,您可以在从输出流构建字符串时提供字符集名称:
try (ByteArrayOutputStream os = new ByteArrayOutputStream()) {
xm.output(os);
assertEquals(originalXML, os.toString("UTF-8"));
}
在那种情况下,应保留特殊字符。