Node.js & co - 避免混合承诺和事件回调

Node.js & co - avoid mixing promises and event callbacks

最近,我一直在试验 phantomjs-node 库。我想要实现的基本上是创建一个动态网页模板,使用 phantomjs-node 库 "run" 它,最后从呈现的页面中提取一些数据。

在最简单的设置中,第一次尝试这样做看起来像这样(在下面的示例中,模板只是静态的,但原则上它可能包含一些利用外部库等的进一步逻辑):

var phantom = require('phantom');
var co = require('co');
var sleep = require('system-sleep');
var winston = require('winston');

const logger = new winston.Logger({
    level: 'debug',
    transports: [new winston.transports.Console({
        json: false, timestamp: () => (new Date()).toLocaleString()
    })]
});

co(function*() {
    logger.info('start');
    var instance = yield phantom.create();   
    try {
        const html = `
                <!DOCTYPE html>
                <html>
                    <head>
                        <title>Page title</title>
                    </head>
                    <body>
                        <div id='results'>Page data</div>
                    </body>
                </html>
            `;

        var page = yield instance.createPage();    

        yield page.on('onLoadFinished', function(){
            logger.info('onLoadFinished');

            page.evaluate(function(){
                return document.getElementById('results').textContent;    
            }).then(function(val){
                logger.info(`RESULT = ${val}`);    
            }).catch(function(val){
                logger.error(val.message);    
            });
        });

        yield page.setContent(html, 'http://localhost');

    }catch (e){
        logger.error(e.message);       
    }finally{
        instance.exit();
    }
    logger.info('done');
});

然而,这失败了,输出:

12/18/2017, 2:44:32 PM - info: start
12/18/2017, 2:44:33 PM - info: done
12/18/2017, 2:44:33 PM - info: onLoadFinished
12/18/2017, 2:44:33 PM - error: Phantom process stopped with exit code 0

很可能是因为当最终调用 page.evaluate 返回的承诺的 then 回调时,主要的幻影进程已经退出。

为了"fix"这个,我采用了以下即兴策略(省略下面示例的其余部分):

    var page = yield instance.createPage();

    var resolver;
    var P = new Promise(function(resolve, reject){ resolver = resolve; });

    yield page.on('onLoadFinished', function(){
        logger.info('onLoadFinished');

        resolver(page.evaluate(function(){
            return document.getElementById('results').textContent;
        }));
    });

    yield page.setContent(html, 'http://localhost');

    const val = yield P;
    logger.info(`RESULT = ${val}`);

这实质上创建了一个新的承诺,它是 "externally" 使用从 page.evaluate 返回的承诺解决的。 co 块末尾的 yield P 语句然后阻塞,直到准备好所需的结果,因此输出符合预期:

12/18/2017, 2:53:47 PM - info: start
12/18/2017, 2:53:48 PM - info: onLoadFinished
12/18/2017, 2:53:48 PM - info: RESULT = .....
12/18/2017, 2:53:48 PM - info: done

虽然这似乎有效,但感觉相当 "hacky"(例如在调用 resolver 之前回调中抛出的异常将不会在主 try/catch 块中检测到),所以我想知道为了 "transfer" 从 onLoadFinished 回调控制回到由 co 管理的领域,什么是更简洁的方法?

  • 不要再使用 co + 生成器函数了。 async/await来了
  • 是的,您应该将(最多)触发一次的所有事件回调转换为承诺。
  • 不,永远不要做出那样的承诺 "resolve them externally"。只需将解决它们的内容放入 promise 构造函数中即可。

(async function() {
    logger.info('start');
    var instance = await phantom.create();   
    try {
        const html = `…`;
        const page = await instance.createPage();    

        await new Promise((resolve, reject) => {
            page.on('loadFinished', resolve);
            page.on('resourceError', reject); // or something like that?
            page.setContent(html, 'http://localhost'); // this doesn't appear to return a promise
        })
        logger.info('onLoadFinished');

        try { // this extra inner try looks superfluous
            const val = await page.evaluate(function(){
                return document.getElementById('results').textContent;    
            });
            logger.info(`RESULT = ${val}`);
        } catch(e) {
            logger.error(e.message);    
        }
    } catch(e) {
        logger.error(e.message);       
    } finally {
        instance.exit();
    }
    logger.info('done');
}());