Node.js & co - 避免混合承诺和事件回调
Node.js & co - avoid mixing promises and event callbacks
最近,我一直在试验 phantomjs-node
库。我想要实现的基本上是创建一个动态网页模板,使用 phantomjs-node
库 "run" 它,最后从呈现的页面中提取一些数据。
在最简单的设置中,第一次尝试这样做看起来像这样(在下面的示例中,模板只是静态的,但原则上它可能包含一些利用外部库等的进一步逻辑):
var phantom = require('phantom');
var co = require('co');
var sleep = require('system-sleep');
var winston = require('winston');
const logger = new winston.Logger({
level: 'debug',
transports: [new winston.transports.Console({
json: false, timestamp: () => (new Date()).toLocaleString()
})]
});
co(function*() {
logger.info('start');
var instance = yield phantom.create();
try {
const html = `
<!DOCTYPE html>
<html>
<head>
<title>Page title</title>
</head>
<body>
<div id='results'>Page data</div>
</body>
</html>
`;
var page = yield instance.createPage();
yield page.on('onLoadFinished', function(){
logger.info('onLoadFinished');
page.evaluate(function(){
return document.getElementById('results').textContent;
}).then(function(val){
logger.info(`RESULT = ${val}`);
}).catch(function(val){
logger.error(val.message);
});
});
yield page.setContent(html, 'http://localhost');
}catch (e){
logger.error(e.message);
}finally{
instance.exit();
}
logger.info('done');
});
然而,这失败了,输出:
12/18/2017, 2:44:32 PM - info: start
12/18/2017, 2:44:33 PM - info: done
12/18/2017, 2:44:33 PM - info: onLoadFinished
12/18/2017, 2:44:33 PM - error: Phantom process stopped with exit code 0
很可能是因为当最终调用 page.evaluate
返回的承诺的 then
回调时,主要的幻影进程已经退出。
为了"fix"这个,我采用了以下即兴策略(省略下面示例的其余部分):
var page = yield instance.createPage();
var resolver;
var P = new Promise(function(resolve, reject){ resolver = resolve; });
yield page.on('onLoadFinished', function(){
logger.info('onLoadFinished');
resolver(page.evaluate(function(){
return document.getElementById('results').textContent;
}));
});
yield page.setContent(html, 'http://localhost');
const val = yield P;
logger.info(`RESULT = ${val}`);
这实质上创建了一个新的承诺,它是 "externally" 使用从 page.evaluate
返回的承诺解决的。 co
块末尾的 yield P
语句然后阻塞,直到准备好所需的结果,因此输出符合预期:
12/18/2017, 2:53:47 PM - info: start
12/18/2017, 2:53:48 PM - info: onLoadFinished
12/18/2017, 2:53:48 PM - info: RESULT = .....
12/18/2017, 2:53:48 PM - info: done
虽然这似乎有效,但感觉相当 "hacky"(例如在调用 resolver
之前回调中抛出的异常将不会在主 try/catch
块中检测到),所以我想知道为了 "transfer" 从 onLoadFinished
回调控制回到由 co
管理的领域,什么是更简洁的方法?
- 不要再使用
co
+ 生成器函数了。 async
/await
来了
- 是的,您应该将(最多)触发一次的所有事件回调转换为承诺。
- 不,永远不要做出那样的承诺 "resolve them externally"。只需将解决它们的内容放入 promise 构造函数中即可。
(async function() {
logger.info('start');
var instance = await phantom.create();
try {
const html = `…`;
const page = await instance.createPage();
await new Promise((resolve, reject) => {
page.on('loadFinished', resolve);
page.on('resourceError', reject); // or something like that?
page.setContent(html, 'http://localhost'); // this doesn't appear to return a promise
})
logger.info('onLoadFinished');
try { // this extra inner try looks superfluous
const val = await page.evaluate(function(){
return document.getElementById('results').textContent;
});
logger.info(`RESULT = ${val}`);
} catch(e) {
logger.error(e.message);
}
} catch(e) {
logger.error(e.message);
} finally {
instance.exit();
}
logger.info('done');
}());
最近,我一直在试验 phantomjs-node
库。我想要实现的基本上是创建一个动态网页模板,使用 phantomjs-node
库 "run" 它,最后从呈现的页面中提取一些数据。
在最简单的设置中,第一次尝试这样做看起来像这样(在下面的示例中,模板只是静态的,但原则上它可能包含一些利用外部库等的进一步逻辑):
var phantom = require('phantom');
var co = require('co');
var sleep = require('system-sleep');
var winston = require('winston');
const logger = new winston.Logger({
level: 'debug',
transports: [new winston.transports.Console({
json: false, timestamp: () => (new Date()).toLocaleString()
})]
});
co(function*() {
logger.info('start');
var instance = yield phantom.create();
try {
const html = `
<!DOCTYPE html>
<html>
<head>
<title>Page title</title>
</head>
<body>
<div id='results'>Page data</div>
</body>
</html>
`;
var page = yield instance.createPage();
yield page.on('onLoadFinished', function(){
logger.info('onLoadFinished');
page.evaluate(function(){
return document.getElementById('results').textContent;
}).then(function(val){
logger.info(`RESULT = ${val}`);
}).catch(function(val){
logger.error(val.message);
});
});
yield page.setContent(html, 'http://localhost');
}catch (e){
logger.error(e.message);
}finally{
instance.exit();
}
logger.info('done');
});
然而,这失败了,输出:
12/18/2017, 2:44:32 PM - info: start
12/18/2017, 2:44:33 PM - info: done
12/18/2017, 2:44:33 PM - info: onLoadFinished
12/18/2017, 2:44:33 PM - error: Phantom process stopped with exit code 0
很可能是因为当最终调用 page.evaluate
返回的承诺的 then
回调时,主要的幻影进程已经退出。
为了"fix"这个,我采用了以下即兴策略(省略下面示例的其余部分):
var page = yield instance.createPage();
var resolver;
var P = new Promise(function(resolve, reject){ resolver = resolve; });
yield page.on('onLoadFinished', function(){
logger.info('onLoadFinished');
resolver(page.evaluate(function(){
return document.getElementById('results').textContent;
}));
});
yield page.setContent(html, 'http://localhost');
const val = yield P;
logger.info(`RESULT = ${val}`);
这实质上创建了一个新的承诺,它是 "externally" 使用从 page.evaluate
返回的承诺解决的。 co
块末尾的 yield P
语句然后阻塞,直到准备好所需的结果,因此输出符合预期:
12/18/2017, 2:53:47 PM - info: start
12/18/2017, 2:53:48 PM - info: onLoadFinished
12/18/2017, 2:53:48 PM - info: RESULT = .....
12/18/2017, 2:53:48 PM - info: done
虽然这似乎有效,但感觉相当 "hacky"(例如在调用 resolver
之前回调中抛出的异常将不会在主 try/catch
块中检测到),所以我想知道为了 "transfer" 从 onLoadFinished
回调控制回到由 co
管理的领域,什么是更简洁的方法?
- 不要再使用
co
+ 生成器函数了。async
/await
来了 - 是的,您应该将(最多)触发一次的所有事件回调转换为承诺。
- 不,永远不要做出那样的承诺 "resolve them externally"。只需将解决它们的内容放入 promise 构造函数中即可。
(async function() {
logger.info('start');
var instance = await phantom.create();
try {
const html = `…`;
const page = await instance.createPage();
await new Promise((resolve, reject) => {
page.on('loadFinished', resolve);
page.on('resourceError', reject); // or something like that?
page.setContent(html, 'http://localhost'); // this doesn't appear to return a promise
})
logger.info('onLoadFinished');
try { // this extra inner try looks superfluous
const val = await page.evaluate(function(){
return document.getElementById('results').textContent;
});
logger.info(`RESULT = ${val}`);
} catch(e) {
logger.error(e.message);
}
} catch(e) {
logger.error(e.message);
} finally {
instance.exit();
}
logger.info('done');
}());