在 C# 中解码字符串时获取未知字符

Getting unknown characters while decoding string in c#

我正在做一个项目,我将表单数据作为 xml 提交并将其以 xml 形式存储到我的数据库中。

在用 c# 解码 xml 数据时,我得到了未知字符。实际上,我正在为例如“Introduzca texto aquí”保存西班牙语文本。

所以在 xml 中,我得到这个 'í' 字符作为 %ED 并且在使用 HttpUtility.UrlDecode(formData) 解码它时我得到 � 而不是 í。

XML解码前的数据

%3CArrayOfDiary%3E%3CDiary%3E%3CDate%3E03042015%3C/Date%3E%3CSituation%3EIntroduzca%20texto%20aqu%ED%3C/Situation%3E%3CSensation%3EIntroduzca%20texto%20aqu%ED%3C/Sensation%3E%3CConcern%3EIntroduzca%20texto%20aqu%ED%3C/Concern%3E%3CBeliefRating%3E0%3C/BeliefRating%3E%3CAnxietyRating%3E0%3C/AnxietyRating%3E%3C/Diary%3E%0A%20%20%3CArrayOfDiary%3E

解码后的数据

<ArrayOfDiary><Diary><Date>03042015</Date><Situation>Introduzca texto aqu�</Situation><Sensation>Introduzca texto aqu�</Sensation><Concern>Introduzca texto aqu�</Concern><BeliefRating>0</BeliefRating><AnxietyRating>0</AnxietyRating></Diary>
<Diary>
<Date>03042015</Date>
<Situation> Introduzca texto aqu�</Situation>
<Sensation> Introduzca texto aqu�</Sensation>
<Concern> Introduzca texto aqu�</Concern>
<BeliefRating>0</BeliefRating>
<AnxietyRating>0</AnxietyRating>
</Diary>
</ArrayOfDiary>

请帮帮我。谢谢

https://msdn.microsoft.com/en-us/library/ms246590.aspx

看看这个页面它应该对你有帮助,听起来你可能没有正确的 LIP

没有看到数据的来源,我假设它是用 ISO-8859-1 编码创建的。

您可以通过在 UrlDecode 中使用适当的编码来解决此问题:

Option Infer On
' ....
Dim s = "%3CArrayOfDiary%3E%3CDiary%3E%3CDate%3E03042015%3C/Date%3E%3CSituation%3EIntroduzca%20texto%20aqu%ED%3C/Situation%3E%3CSensation%3EIntroduzca%20texto%20aqu%ED%3C/Sensation%3E%3CConcern%3EIntroduzca%20texto%20aqu%ED%3C/Concern%3E%3CBeliefRating%3E0%3C/BeliefRating%3E%3CAnxietyRating%3E0%3C/AnxietyRating%3E%3C/Diary%3E%0A%20%20%3CArrayOfDiary%3E"
Dim enc = Encoding.GetEncoding("ISO-8859-1")
Dim txt = Web.HttpUtility.UrlDecode(s, enc)

为避免这种麻烦,您可以在网页的 <head> 部分使用 <meta charset="utf-8" />。如果您想表明该页面是西班牙语,您仍然可以使用 <html lang="es">