Html 敏捷包 - 如何在嵌套元素中 Select 首先 link

Html Agility Pack - How to Select first link in nested elemets

这是我的 HTML 代码。如何先 select link(Main link 1, Main link 2,...) 在 <li id="item1"> ,<li id="item2"> 等之后

<div id="mainmenu">
<div class="wrapper">
    <div class="main-menu">
        <ul class="navigation">
            <li class="menu-group">
                <ul>
                    <li id="item1">
                        <a href="/">Main link 1</a>

                        <div id="item1-sub">
                            <ul>
                                <li>
                                    <a href="#1">subLink1</a>
                                </li>
                                <li>
                                    <a href="#1">subLink2</a>
                                </li>
                            </ul>
                        </div>
                    </li>
                    <li id="item2">
                        <a href="/">Main link 2</a>

                        <div id="item2-sub">
                            <ul>
                                <li>
                                    <a href="#1">subLink1</a>
                                </li>
                                <li>
                                    <a href="#1">subLink2</a>
                                </li>
                            </ul>
                        </div>
                    </li>
                </ul>
            </li>
        </ul>
    </div>
</div>

C#代码: 这段代码有问题。希望有人能帮忙解决问题

var webGet = new HtmlWeb();
var document = webGet.Load("file.html");
var menuGroup = document.DocumentNode.SelectNodes("//div[@id='mainmenu']//div[@class='wrapper']//div[@class='main-menu']//ul[@class='navigation']//li[@class='menu-group']//ul//li");
if (menuGroup != null)
{
  foreach (var Tag in menuGroup)
  {
    var atag = Tag.SelectSingleNode("./a");
  }
}

你可以这样做

var html = "<html><head></head><body><div id=\"mainmenu\"><div class=\"wrapper\"><div class=\"main-menu\"><ul class=\"navigation\"><li class=\"menu-group\"><ul><li id=\"item1\">" +
        "<a href=\"/\">Main link 1</a><div id=\"item1-sub\"><ul><li><a href=\"#1\">subLink1</a></li><li><a href=\"#1\">subLink2</a></li></ul></div></li><li id=\"item2\">" +
        "<a href=\"/\">Main link 2</a><div id=\"item2-sub\"><ul><li><a href=\"#1\">subLink1</a></li><li><a href=\"#1\">subLink2</a></li></ul></div></li></ul></li></ul></div></div></div></body></html>";
var doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(html);

var mainLink1 = doc.DocumentNode.SelectSingleNode("//li[@id='item1']//a");
var linkUrl1 = mainLink1.Attributes["href"].Value;
var linkText1 = mainLink1.InnerText;

var mainLink2 = doc.DocumentNode.SelectSingleNode("//li[@id='item2']//a");
var linkUrl2 = mainLink2.Attributes["href"].Value;
var linkText2 = mainLink2.InnerText;

输出:

编辑:

使用以下代码通过循环获取主要链接,这将只选择您想要的链接。

foreach (var div in doc.DocumentNode.SelectNodes("//li[@class='menu-group']//ul//li//div"))
{
    div.InnerHtml = string.Empty;
}
foreach (var a in doc.DocumentNode.SelectNodes("//li[@class='menu-group']//ul//li//a"))
{
    var linkUrl = a.Attributes["href"].Value;
    var linkText = a.InnerText;
}