JSoup - 解析这个嵌套的 HTML 无序列表
JSoup - Parsing this nested HTML unordered list
我正在尝试从网站解析这个嵌套的 HTML,但我无法弄清楚如何从无序列表中获取数据。
<ul class="no-bullet participants-list" data-registrations="registrants">
<li class="participant" data-participant-id="512028" data-registrations="registrant">
<div class="row collapse participant-info">
<div class="large-1 small-2 columns">
<figure class="participant-avatar">
<a class="user-profile-link" href="THE LINK I WANT">
我试过的
for(Element row : doc.select("ul.no-bullet participants-list")) {
row.select("li.participant")
.select("div.row collapse participant-info")
.select("div.large-1 small-2 columns")
.select("figure.participant-avatar")
.select("a.href").text());
}
不确定我做错了什么
据我所知,您正在寻找 a 标签内的 href 属性
您的 select 语句不正确,因为您使用 space 而不是点来选择 class
而不是这个
doc.select("ul.no-bullet participants-list")
使用这个
doc.select("ul.no-bullet.participants-list a").first().attr("href")
如你所见,我首先选择了 a 标签并从该标签中获取 href
我正在尝试从网站解析这个嵌套的 HTML,但我无法弄清楚如何从无序列表中获取数据。
<ul class="no-bullet participants-list" data-registrations="registrants">
<li class="participant" data-participant-id="512028" data-registrations="registrant">
<div class="row collapse participant-info">
<div class="large-1 small-2 columns">
<figure class="participant-avatar">
<a class="user-profile-link" href="THE LINK I WANT">
我试过的
for(Element row : doc.select("ul.no-bullet participants-list")) {
row.select("li.participant")
.select("div.row collapse participant-info")
.select("div.large-1 small-2 columns")
.select("figure.participant-avatar")
.select("a.href").text());
}
不确定我做错了什么
据我所知,您正在寻找 a 标签内的 href 属性 您的 select 语句不正确,因为您使用 space 而不是点来选择 class
而不是这个
doc.select("ul.no-bullet participants-list")
使用这个
doc.select("ul.no-bullet.participants-list a").first().attr("href")
如你所见,我首先选择了 a 标签并从该标签中获取 href