如何使用 HtmlAgilityPack 删除空 html 节点?
How to remove empty html nodes with HtmlAgilityPack?
我正在尝试使用 HtmlAgilityPack 删除空 html 节点。我想像这样删除所有节点:
<p><span> </span></p>
这是我正在尝试的方法,但它不起作用:
static string RemoveEmptyParagraphs(string html)
{
HtmlDocument document = new HtmlAgilityPack.HtmlDocument();
document.LoadHtml(html);
foreach (HtmlNode eachNode in document.DocumentNode.SelectNodes("//p/span/text() = ' '"))
eachNode.Remove();
html = document.DocumentNode.OuterHtml;
return html;
}
在使用 document.LoadHtml(html);
加载 html 之前,您可以这样做:
document.LoadHtml(html.Replace("<p><span> </span></p>", ""));
或者看看this:
static void RemoveEmptyNodes(HtmlNode containerNode)
{
if (containerNode.Attributes.Count == 0 && !_notToRemove.Contains(containerNode.Name) && (containerNode.InnerText == null || containerNode.InnerText == string.Empty) )
{
containerNode.Remove();
}
else
{
for (int i = containerNode.ChildNodes.Count - 1; i >= 0; i-- )
{
RemoveEmptyNodes(containerNode.ChildNodes[i]);
}
}
}
我正在尝试使用 HtmlAgilityPack 删除空 html 节点。我想像这样删除所有节点:
<p><span> </span></p>
这是我正在尝试的方法,但它不起作用:
static string RemoveEmptyParagraphs(string html)
{
HtmlDocument document = new HtmlAgilityPack.HtmlDocument();
document.LoadHtml(html);
foreach (HtmlNode eachNode in document.DocumentNode.SelectNodes("//p/span/text() = ' '"))
eachNode.Remove();
html = document.DocumentNode.OuterHtml;
return html;
}
在使用 document.LoadHtml(html);
加载 html 之前,您可以这样做:
document.LoadHtml(html.Replace("<p><span> </span></p>", ""));
或者看看this:
static void RemoveEmptyNodes(HtmlNode containerNode)
{
if (containerNode.Attributes.Count == 0 && !_notToRemove.Contains(containerNode.Name) && (containerNode.InnerText == null || containerNode.InnerText == string.Empty) )
{
containerNode.Remove();
}
else
{
for (int i = containerNode.ChildNodes.Count - 1; i >= 0; i-- )
{
RemoveEmptyNodes(containerNode.ChildNodes[i]);
}
}
}