X-Ray Paginate 按文本过滤
X-Ray Paginate filter by text
我正在使用 X 射线抓取带有分页的网页。这里有一些 HTML
<td align="center" style="font-size: 11pt;">
<div class="paginate" style="font-size: 11pt;">
<span class="disabled">Previous</span>
<span class="current">1</span>
<a href="link2.html">2</a>
<a href="link2.html">Next</a>
</div>
</td>
我想通过 Next
按钮删除。但是网页示例被它的 class 名称抓取了。
x('https://blog.ycombinator.com/', '.post', [{
title: 'h1 a',
link: '.article-title@href'
}])
.paginate('.nav-previous a@href')
我想知道如何通过选择 Next
按钮中的 link 来分页?
提前致谢。
按文本过滤
.paginate('.paginate a:contains(Next)@href')
也许这可以帮助你在分页中写这个
.paginate('.paginate > li.current + a > a@href')
or
.paginate('.paginate > li.current > a@href')
我正在使用 X 射线抓取带有分页的网页。这里有一些 HTML
<td align="center" style="font-size: 11pt;">
<div class="paginate" style="font-size: 11pt;">
<span class="disabled">Previous</span>
<span class="current">1</span>
<a href="link2.html">2</a>
<a href="link2.html">Next</a>
</div>
</td>
我想通过 Next
按钮删除。但是网页示例被它的 class 名称抓取了。
x('https://blog.ycombinator.com/', '.post', [{
title: 'h1 a',
link: '.article-title@href'
}])
.paginate('.nav-previous a@href')
我想知道如何通过选择 Next
按钮中的 link 来分页?
提前致谢。
按文本过滤
.paginate('.paginate a:contains(Next)@href')
也许这可以帮助你在分页中写这个
.paginate('.paginate > li.current + a > a@href')
or
.paginate('.paginate > li.current > a@href')