如何删除 windows-1251 字符集中字符串中的未知字符
How to remove unknown chars on string in windows-1251 charset
我有一个无法转换为 windows-1251 字符集的文本。例如:
中华全国工商业联合会-HelloWorld
我有一个从 UTF8 转换为 windows-1251 的方法:
static string ChangeEncoding(string text)
{
if (text == null || text == "")
return "";
Encoding win1251 = Encoding.GetEncoding("windows-1251");
Encoding ascii = Encoding.UTF8;
byte[] utfBytes = ascii.GetBytes(text);
byte[] isoBytes = Encoding.Convert(ascii, win1251, utfBytes);
return win1251.GetString(isoBytes);
}
现在它返回这个:
??????????-HelloWorld
我不想显示未正确转换为 windows1251 字符集的字符。在这种情况下,我只想:
-HelloWorld
我该怎么做?
根据@JeroenMostert 的建议,这个方法帮助了我:
public static string ChangeEncoding(string text)
{
Encoding win1251 = Encoding.GetEncoding("windows-1251", new EncoderReplacementFallback(string.Empty), new DecoderExceptionFallback());
return win1251.GetString(Encoding.Convert(Encoding.UTF8, win1251, Encoding.UTF8.GetBytes(text)));
}
我有一个无法转换为 windows-1251 字符集的文本。例如:
中华全国工商业联合会-HelloWorld
我有一个从 UTF8 转换为 windows-1251 的方法:
static string ChangeEncoding(string text)
{
if (text == null || text == "")
return "";
Encoding win1251 = Encoding.GetEncoding("windows-1251");
Encoding ascii = Encoding.UTF8;
byte[] utfBytes = ascii.GetBytes(text);
byte[] isoBytes = Encoding.Convert(ascii, win1251, utfBytes);
return win1251.GetString(isoBytes);
}
现在它返回这个:
??????????-HelloWorld
我不想显示未正确转换为 windows1251 字符集的字符。在这种情况下,我只想:
-HelloWorld
我该怎么做?
根据@JeroenMostert 的建议,这个方法帮助了我:
public static string ChangeEncoding(string text)
{
Encoding win1251 = Encoding.GetEncoding("windows-1251", new EncoderReplacementFallback(string.Empty), new DecoderExceptionFallback());
return win1251.GetString(Encoding.Convert(Encoding.UTF8, win1251, Encoding.UTF8.GetBytes(text)));
}