在 nightmare.js 中循环 url 时的异步挑战
Async challenge when looping over urls in nightmare.js
我正在使用异步模块通过 nightmarejs 迭代多个 urls。我无法创建新的噩梦实例,因为我每次都必须重新进行身份验证。
所以我正在尝试使用异步模块。我遇到了一个(我认为是经典的)问题,所有迭代的 url 是数组中的最后一个 url - 而不是每个单独的 url。我以为使用 async 模块可以解决这个问题(我也试过使用 let)但我仍然遇到问题
'use strict'
var Nightmare = require("nightmare");
var async = require("async");
//Creates the authenticated nightmare instance
var scraper = new Nightmare()
.goto('https://www.example.com/signin')
.type('#login', 'username')
.type('#password', 'password')
.click('#btn')
.run(function(err, nightmare) {
if (err) {
console.log(err);
}
console.log('Done.');
});
//Trying to use async module to iterate through urls
function load(url, callback){
scraper
.goto(url)
.wait(2000)
.screenshot('pic'+url[25]+'.png')
.run(function(err, nightmare) {
if (err) {
console.log(err);
}
console.log('Done with ', url[25]);
callback()
});
}
var urls = [
'https://www.example.com/p1',
'https://www.example.com/p2',
'https://www.example.com/p3',
]
async.each(urls, load, function (err) {
console.log('done!');
});
感谢任何建议
问题在于这一行:
async.each(urls, load, function (err) {
默认情况下,async
运行s each
并行(see the documentation here,如果你好奇的话)。 Nightmare 无法并行执行多个请求,因此,这样做会导致您所看到的错误结果。
解决方案很简单:改用 async.eachSeries
。这将保证您的请求将 运行 串联,让 Nightmare 按设计工作。
我正在使用异步模块通过 nightmarejs 迭代多个 urls。我无法创建新的噩梦实例,因为我每次都必须重新进行身份验证。
所以我正在尝试使用异步模块。我遇到了一个(我认为是经典的)问题,所有迭代的 url 是数组中的最后一个 url - 而不是每个单独的 url。我以为使用 async 模块可以解决这个问题(我也试过使用 let)但我仍然遇到问题
'use strict'
var Nightmare = require("nightmare");
var async = require("async");
//Creates the authenticated nightmare instance
var scraper = new Nightmare()
.goto('https://www.example.com/signin')
.type('#login', 'username')
.type('#password', 'password')
.click('#btn')
.run(function(err, nightmare) {
if (err) {
console.log(err);
}
console.log('Done.');
});
//Trying to use async module to iterate through urls
function load(url, callback){
scraper
.goto(url)
.wait(2000)
.screenshot('pic'+url[25]+'.png')
.run(function(err, nightmare) {
if (err) {
console.log(err);
}
console.log('Done with ', url[25]);
callback()
});
}
var urls = [
'https://www.example.com/p1',
'https://www.example.com/p2',
'https://www.example.com/p3',
]
async.each(urls, load, function (err) {
console.log('done!');
});
感谢任何建议
问题在于这一行:
async.each(urls, load, function (err) {
默认情况下,async
运行s each
并行(see the documentation here,如果你好奇的话)。 Nightmare 无法并行执行多个请求,因此,这样做会导致您所看到的错误结果。
解决方案很简单:改用 async.eachSeries
。这将保证您的请求将 运行 串联,让 Nightmare 按设计工作。