Html 敏捷包 - 如何在嵌套元素中 Select 首先 link
Html Agility Pack - How to Select first link in nested elemets
这是我的 HTML 代码。如何先 select link(Main link 1, Main link 2,...) 在 <li id="item1">
,<li id="item2">
等之后
<div id="mainmenu">
<div class="wrapper">
<div class="main-menu">
<ul class="navigation">
<li class="menu-group">
<ul>
<li id="item1">
<a href="/">Main link 1</a>
<div id="item1-sub">
<ul>
<li>
<a href="#1">subLink1</a>
</li>
<li>
<a href="#1">subLink2</a>
</li>
</ul>
</div>
</li>
<li id="item2">
<a href="/">Main link 2</a>
<div id="item2-sub">
<ul>
<li>
<a href="#1">subLink1</a>
</li>
<li>
<a href="#1">subLink2</a>
</li>
</ul>
</div>
</li>
</ul>
</li>
</ul>
</div>
</div>
C#代码:
这段代码有问题。希望有人能帮忙解决问题
var webGet = new HtmlWeb();
var document = webGet.Load("file.html");
var menuGroup = document.DocumentNode.SelectNodes("//div[@id='mainmenu']//div[@class='wrapper']//div[@class='main-menu']//ul[@class='navigation']//li[@class='menu-group']//ul//li");
if (menuGroup != null)
{
foreach (var Tag in menuGroup)
{
var atag = Tag.SelectSingleNode("./a");
}
}
你可以这样做
var html = "<html><head></head><body><div id=\"mainmenu\"><div class=\"wrapper\"><div class=\"main-menu\"><ul class=\"navigation\"><li class=\"menu-group\"><ul><li id=\"item1\">" +
"<a href=\"/\">Main link 1</a><div id=\"item1-sub\"><ul><li><a href=\"#1\">subLink1</a></li><li><a href=\"#1\">subLink2</a></li></ul></div></li><li id=\"item2\">" +
"<a href=\"/\">Main link 2</a><div id=\"item2-sub\"><ul><li><a href=\"#1\">subLink1</a></li><li><a href=\"#1\">subLink2</a></li></ul></div></li></ul></li></ul></div></div></div></body></html>";
var doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(html);
var mainLink1 = doc.DocumentNode.SelectSingleNode("//li[@id='item1']//a");
var linkUrl1 = mainLink1.Attributes["href"].Value;
var linkText1 = mainLink1.InnerText;
var mainLink2 = doc.DocumentNode.SelectSingleNode("//li[@id='item2']//a");
var linkUrl2 = mainLink2.Attributes["href"].Value;
var linkText2 = mainLink2.InnerText;
输出:
编辑:
使用以下代码通过循环获取主要链接,这将只选择您想要的链接。
foreach (var div in doc.DocumentNode.SelectNodes("//li[@class='menu-group']//ul//li//div"))
{
div.InnerHtml = string.Empty;
}
foreach (var a in doc.DocumentNode.SelectNodes("//li[@class='menu-group']//ul//li//a"))
{
var linkUrl = a.Attributes["href"].Value;
var linkText = a.InnerText;
}
这是我的 HTML 代码。如何先 select link(Main link 1, Main link 2,...) 在 <li id="item1">
,<li id="item2">
等之后
<div id="mainmenu">
<div class="wrapper">
<div class="main-menu">
<ul class="navigation">
<li class="menu-group">
<ul>
<li id="item1">
<a href="/">Main link 1</a>
<div id="item1-sub">
<ul>
<li>
<a href="#1">subLink1</a>
</li>
<li>
<a href="#1">subLink2</a>
</li>
</ul>
</div>
</li>
<li id="item2">
<a href="/">Main link 2</a>
<div id="item2-sub">
<ul>
<li>
<a href="#1">subLink1</a>
</li>
<li>
<a href="#1">subLink2</a>
</li>
</ul>
</div>
</li>
</ul>
</li>
</ul>
</div>
</div>
C#代码: 这段代码有问题。希望有人能帮忙解决问题
var webGet = new HtmlWeb();
var document = webGet.Load("file.html");
var menuGroup = document.DocumentNode.SelectNodes("//div[@id='mainmenu']//div[@class='wrapper']//div[@class='main-menu']//ul[@class='navigation']//li[@class='menu-group']//ul//li");
if (menuGroup != null)
{
foreach (var Tag in menuGroup)
{
var atag = Tag.SelectSingleNode("./a");
}
}
你可以这样做
var html = "<html><head></head><body><div id=\"mainmenu\"><div class=\"wrapper\"><div class=\"main-menu\"><ul class=\"navigation\"><li class=\"menu-group\"><ul><li id=\"item1\">" +
"<a href=\"/\">Main link 1</a><div id=\"item1-sub\"><ul><li><a href=\"#1\">subLink1</a></li><li><a href=\"#1\">subLink2</a></li></ul></div></li><li id=\"item2\">" +
"<a href=\"/\">Main link 2</a><div id=\"item2-sub\"><ul><li><a href=\"#1\">subLink1</a></li><li><a href=\"#1\">subLink2</a></li></ul></div></li></ul></li></ul></div></div></div></body></html>";
var doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(html);
var mainLink1 = doc.DocumentNode.SelectSingleNode("//li[@id='item1']//a");
var linkUrl1 = mainLink1.Attributes["href"].Value;
var linkText1 = mainLink1.InnerText;
var mainLink2 = doc.DocumentNode.SelectSingleNode("//li[@id='item2']//a");
var linkUrl2 = mainLink2.Attributes["href"].Value;
var linkText2 = mainLink2.InnerText;
输出:
编辑:
使用以下代码通过循环获取主要链接,这将只选择您想要的链接。
foreach (var div in doc.DocumentNode.SelectNodes("//li[@class='menu-group']//ul//li//div"))
{
div.InnerHtml = string.Empty;
}
foreach (var a in doc.DocumentNode.SelectNodes("//li[@class='menu-group']//ul//li//a"))
{
var linkUrl = a.Attributes["href"].Value;
var linkText = a.InnerText;
}