C# File.ReadAllText 编码.Utf8

C# File.ReadAllText Encoding.Utf8

我尝试从 HTML 文件中读取字符串。 这是我的代码:

string result = File.ReadAllText(@"C:\temp\invoice.html", Encoding.UTF8);

由于html文件的字符集是charset=windows124,结果值不是utf-8

结果值包含;

 �</span><br>BAH�EL�EVLER<span>

根据您在个人资料下指定的位置,我假设您指的是 windows-1254(土耳其语)?

尝试:

Encoding turkishEncoding = Encoding.GetEncoding("windows-1254");
string result = File.ReadAllText(@"C:\temp\invoice.html", turkishEncoding);

作为参考,请参阅 encodings-list 下的内容:https://docs.microsoft.com/en-us/dotnet/api/system.text.encoding?view=net-6.0