解析htmlmvc时解码特殊字符
Decode special characters when parsing html mvc
在我的 mvc 网络应用程序中,我正在尝试解析 html 文档。它似乎工作正常,但唯一的问题是它给了我特殊的章程并且不能正确解析像 æ、å、ø 等字符。
这是我的代码
var html = new HtmlDocument();
html.LoadHtml(new WebClient().DownloadString("http://cricketforbundet.no/index.php/en/klubber"));
var root = html.DocumentNode;
var p = root.Descendants("table").FirstOrDefault().Descendants("tr").Skip(1).FirstOrDefault().ChildNodes.Where(i=>i.Name == "td").FirstOrDefault().InnerText;
我在 p 得到了 Bjørvika Cricket Klubb 我应该得到 Bjørvika Cricket Klubb.
有什么想法吗?我正在使用 HtmlAgilityPack 解析 ASP.NET
中的 HTML
您必须使用 load
而不是 LoadHtml
并确保使用 UTF8
编码
WebClient webClient = new WebClient();
HtmlDocument html = new HtmlDocument();
html.Load(webClient.OpenRead("http://cricketforbundet.no/index.php/en/klubber"), Encoding.UTF8);
var root = html.DocumentNode;
var p = root.Descendants("table").FirstOrDefault().Descendants("tr").Skip(1).FirstOrDefault().ChildNodes.Where(i => i.Name == "td").FirstOrDefault().InnerText;
检查这个 answer
在我的 mvc 网络应用程序中,我正在尝试解析 html 文档。它似乎工作正常,但唯一的问题是它给了我特殊的章程并且不能正确解析像 æ、å、ø 等字符。
这是我的代码
var html = new HtmlDocument();
html.LoadHtml(new WebClient().DownloadString("http://cricketforbundet.no/index.php/en/klubber"));
var root = html.DocumentNode;
var p = root.Descendants("table").FirstOrDefault().Descendants("tr").Skip(1).FirstOrDefault().ChildNodes.Where(i=>i.Name == "td").FirstOrDefault().InnerText;
我在 p 得到了 Bjørvika Cricket Klubb 我应该得到 Bjørvika Cricket Klubb.
有什么想法吗?我正在使用 HtmlAgilityPack 解析 ASP.NET
中的 HTML您必须使用 load
而不是 LoadHtml
并确保使用 UTF8
编码
WebClient webClient = new WebClient();
HtmlDocument html = new HtmlDocument();
html.Load(webClient.OpenRead("http://cricketforbundet.no/index.php/en/klubber"), Encoding.UTF8);
var root = html.DocumentNode;
var p = root.Descendants("table").FirstOrDefault().Descendants("tr").Skip(1).FirstOrDefault().ChildNodes.Where(i => i.Name == "td").FirstOrDefault().InnerText;
检查这个 answer