解析htmlmvc时解码特殊字符

Decode special characters when parsing html mvc

在我的 mvc 网络应用程序中,我正在尝试解析 html 文档。它似乎工作正常,但唯一的问题是它给了我特殊的章程并且不能正确解析像 æ、å、ø 等字符。

这是我的代码

var html = new HtmlDocument();
html.LoadHtml(new WebClient().DownloadString("http://cricketforbundet.no/index.php/en/klubber"));
var root = html.DocumentNode;
var p = root.Descendants("table").FirstOrDefault().Descendants("tr").Skip(1).FirstOrDefault().ChildNodes.Where(i=>i.Name == "td").FirstOrDefault().InnerText;

我在 p 得到了 Bjørvika Cricket Klubb 我应该得到 Bjørvika Cricket Klubb.

有什么想法吗?我正在使用 HtmlAgilityPack 解析 ASP.NET

中的 HTML

您必须使用 load 而不是 LoadHtml 并确保使用 UTF8 编码

        WebClient webClient = new WebClient();
        HtmlDocument html = new HtmlDocument();
        html.Load(webClient.OpenRead("http://cricketforbundet.no/index.php/en/klubber"), Encoding.UTF8);
        var root = html.DocumentNode;
        var p = root.Descendants("table").FirstOrDefault().Descendants("tr").Skip(1).FirstOrDefault().ChildNodes.Where(i => i.Name == "td").FirstOrDefault().InnerText;

检查这个 answer