XML 使用UTF-8编码的字符“°”后解析错误API
XML Parsing error after using the character "°" with UTF-8 encoding API
我在解析 xml 文件时遇到问题。
字符序列中有一个“°”,我收到通知:“XML 第 1048 行的解析错误:输入不是正确的 UTF-8,指示编码!”。我对“&”字符有同样的问题,但我通过输入“&”解决了它
这是 XML 文件的一部分:
<OrganisationListItem>
<Branch>
<Partner>
<PartnerShortName>xxxxx</PartnerShortName>
<BranchShortName>xxxxx</BranchShortName>
</Partner>
<BranchNumber>xxxxx</BranchNumber>
<BusinessName>xxxxx</BusinessName>
<StartDate>xxxxxx</StartDate>
<DisplayWeb>xxxxx</DisplayWeb>
<Address>
<Street>xxxxx 1° xxxxx</Street>
<ZipCode>xxxxxx</ZipCode>
<City>xxxxx</City>
<CountryCode>xxxxx</CountryCode>
</Address>
</Branch>
</OrganisationListItem>
第 1048 行是:“xxxxx 1° xxxxx”。 “无效的 UTF-8 起始字节 0xb0(位于字符 #28494,字节 #27999)”
该文件以声明编码为 UTF-8 的声明开始,因此解析器试图将其解码为 UTF-8,并且成功解码所有内容,直到找到您显示为“ °”,但这显然不是“°”的正确 UTF-8 编码。要查看实际编码是什么,请查看十六进制编辑器中的内容;很有可能是 iso-8859-1 或类似的东西。
要解决此问题,请检查创建文档的过程,以发现 header 中声明的编码与字符编码的实际方式不匹配的原因。错误可能在文档首次创建时没有出现,但后来由于某些转码而发生,例如将文件从一台机器发送到另一台机器时。
如果您手动编辑文件,请尝试使用能够理解 XML 的文本编辑器;这使得这个问题不太可能发生。
我在解析 xml 文件时遇到问题。 字符序列中有一个“°”,我收到通知:“XML 第 1048 行的解析错误:输入不是正确的 UTF-8,指示编码!”。我对“&”字符有同样的问题,但我通过输入“&”解决了它 这是 XML 文件的一部分:
<OrganisationListItem>
<Branch>
<Partner>
<PartnerShortName>xxxxx</PartnerShortName>
<BranchShortName>xxxxx</BranchShortName>
</Partner>
<BranchNumber>xxxxx</BranchNumber>
<BusinessName>xxxxx</BusinessName>
<StartDate>xxxxxx</StartDate>
<DisplayWeb>xxxxx</DisplayWeb>
<Address>
<Street>xxxxx 1° xxxxx</Street>
<ZipCode>xxxxxx</ZipCode>
<City>xxxxx</City>
<CountryCode>xxxxx</CountryCode>
</Address>
</Branch>
</OrganisationListItem>
第 1048 行是:“xxxxx 1° xxxxx”。 “无效的 UTF-8 起始字节 0xb0(位于字符 #28494,字节 #27999)”
该文件以声明编码为 UTF-8 的声明开始,因此解析器试图将其解码为 UTF-8,并且成功解码所有内容,直到找到您显示为“ °”,但这显然不是“°”的正确 UTF-8 编码。要查看实际编码是什么,请查看十六进制编辑器中的内容;很有可能是 iso-8859-1 或类似的东西。
要解决此问题,请检查创建文档的过程,以发现 header 中声明的编码与字符编码的实际方式不匹配的原因。错误可能在文档首次创建时没有出现,但后来由于某些转码而发生,例如将文件从一台机器发送到另一台机器时。
如果您手动编辑文件,请尝试使用能够理解 XML 的文本编辑器;这使得这个问题不太可能发生。