在 XML 中使其无法解析
  in XML making it unparseable
所以我的数据库中有一个值,其中有一个非中断 space,格式为  
。我有一个遗留服务,它从数据库中读取这个字符串并使用这个字符串创建一个 XML。我面临的问题是为此消息返回的 XML 无法解析。当我在记事本++中打开它时,我在非中断 space 的位置看到字符 xA0
,并且在删除该字符后,XML 变得可解析。此外,我有来自同一服务的此 XML 文件的旧版本,其中字符 "Â "
代替了不间断的 space。我最近更改了服务 运行 所在的 tomcat 服务器,因此出现了问题。我发现这个 post 根据它我的 XML 被编码为 ISO-8859-1;
但我用来将 XML 转换为字符串的代码不使用 ISO-8859-1;
。下面是我的代码
private String nodeToString(Node node) {
StringWriter sw = new StringWriter();
try {
Transformer t = TransformerFactory.newInstance().newTransformer();
t.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "no");
t.transform(new DOMSource(node), new StreamResult(sw));
} catch (TransformerException te) {
LOG.error("Exception during String to XML transformation ", te);
}
return sw.toString();
}
我想知道为什么我的 XML 无法解析,为什么 XML 文件的旧版本中有 "Â "
。
这是notepad++中问题字符的图片
image in notepad++
此外,当我在记事本中打开 XML 并尝试保存它时,我看到编码类型是 ANSI,当我将其更改为 UTF-8 然后保存时,XML 变得可解析.
新信息 - 使用 transformer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
强制执行 UTF-8 无效 我仍然在我的 XML.
中获取 xA0
问题是我的 java 版本以某种方式将我的文件保存为 ANSI 文件格式。当我在记事本中打开我的文件并试图保存它时,我看到了这个。旧文件采用 UTF-8
格式。所以我所做的就是在编写文件时指定 UTF-8
编码。
Writer out = new BufferedWriter(new OutputStreamWriter(
new FileOutputStream(fileName.trim()), StandardCharsets.UTF_8));
try {
out.write(data);
} finally {
out.close();
}
所以我的数据库中有一个值,其中有一个非中断 space,格式为  
。我有一个遗留服务,它从数据库中读取这个字符串并使用这个字符串创建一个 XML。我面临的问题是为此消息返回的 XML 无法解析。当我在记事本++中打开它时,我在非中断 space 的位置看到字符 xA0
,并且在删除该字符后,XML 变得可解析。此外,我有来自同一服务的此 XML 文件的旧版本,其中字符 "Â "
代替了不间断的 space。我最近更改了服务 运行 所在的 tomcat 服务器,因此出现了问题。我发现这个 post 根据它我的 XML 被编码为 ISO-8859-1;
但我用来将 XML 转换为字符串的代码不使用 ISO-8859-1;
。下面是我的代码
private String nodeToString(Node node) {
StringWriter sw = new StringWriter();
try {
Transformer t = TransformerFactory.newInstance().newTransformer();
t.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "no");
t.transform(new DOMSource(node), new StreamResult(sw));
} catch (TransformerException te) {
LOG.error("Exception during String to XML transformation ", te);
}
return sw.toString();
}
我想知道为什么我的 XML 无法解析,为什么 XML 文件的旧版本中有 "Â "
。
这是notepad++中问题字符的图片 image in notepad++
此外,当我在记事本中打开 XML 并尝试保存它时,我看到编码类型是 ANSI,当我将其更改为 UTF-8 然后保存时,XML 变得可解析.
新信息 - 使用 transformer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
强制执行 UTF-8 无效 我仍然在我的 XML.
问题是我的 java 版本以某种方式将我的文件保存为 ANSI 文件格式。当我在记事本中打开我的文件并试图保存它时,我看到了这个。旧文件采用 UTF-8
格式。所以我所做的就是在编写文件时指定 UTF-8
编码。
Writer out = new BufferedWriter(new OutputStreamWriter(
new FileOutputStream(fileName.trim()), StandardCharsets.UTF_8));
try {
out.write(data);
} finally {
out.close();
}