如何点击带有 page.link 但没有 ID 的 link(它有 class)
How to click on a link with page.link but without id (it has class)
这是我现在的代码
async function main(){
for(int=0;int<50;int++){
const allLinks = await getLinks();
//console.log(allLinks);
const browser = await puppeteer.launch({ headless: true });
const page = await browser.newPage();
const scrapedData = [];
for(let link of allLinks){
const data = await getPageData(link,page);
// const secondToWait = (Math.floor(Math.random()*5) + 1)*100; //número aleatorio entre 1000 y 4000 (entre 1 y 4 segundos)
// await page.waitForTimeout(3000) //van a quitar 'waitfor', pero 'waitForTimeout' es parecido; waits 3 seconds before it goes to the next page (a veces que cargen tan rápido las páginas puede causar problemas)
scrapedData.push(data);
}
await page.click('#next a');
}
“#next”是 class,但它确实有效,因为我需要 ID。有什么方法可以解决吗?我试图找到,但我只找到底部的 answares,并且在我的情况下 dosent 工作。
这是我正在抓取的页面中的代码
<div>
<ul class="pager">
<li class="current">
Page 1 of 50
</li>
<li class="next"><a href="catalogue/page-2.html">next</a></li>
</ul>
</div>
</div>
</section>
#
用于ID,对于class使用点.
所以它
await page.click('.next a');
这是我现在的代码
async function main(){
for(int=0;int<50;int++){
const allLinks = await getLinks();
//console.log(allLinks);
const browser = await puppeteer.launch({ headless: true });
const page = await browser.newPage();
const scrapedData = [];
for(let link of allLinks){
const data = await getPageData(link,page);
// const secondToWait = (Math.floor(Math.random()*5) + 1)*100; //número aleatorio entre 1000 y 4000 (entre 1 y 4 segundos)
// await page.waitForTimeout(3000) //van a quitar 'waitfor', pero 'waitForTimeout' es parecido; waits 3 seconds before it goes to the next page (a veces que cargen tan rápido las páginas puede causar problemas)
scrapedData.push(data);
}
await page.click('#next a');
}
“#next”是 class,但它确实有效,因为我需要 ID。有什么方法可以解决吗?我试图找到,但我只找到底部的 answares,并且在我的情况下 dosent 工作。
这是我正在抓取的页面中的代码
<div>
<ul class="pager">
<li class="current">
Page 1 of 50
</li>
<li class="next"><a href="catalogue/page-2.html">next</a></li>
</ul>
</div>
</div>
</section>
#
用于ID,对于class使用点.
所以它
await page.click('.next a');