噩梦 HTTPS 选项:ignoreSslErrors 和 sslProtocol 不适用于 phantomJS
Nightmare HTTPS Options: ignoreSslErrors and sslProtocol not working for phantomJS
[ phantomjs -v 1.9.7 ] 与
噩梦:
https://github.com/segmentio/nightmare
通过那个使用超时选项的示例,我已经尽可能地设置了选项:
new Nightmare({ignoreSslErrors : 'true', sslProtocol : 'tlsv1'})
也试过
new Nightmare({ignoreSslErrors : true, sslProtocol : 'tlsv1'})
它不会打开 https 页面。
如果我直接使用 phantomjs 来点击同一个页面,它工作正常:
phantomjs --ignore-ssl-errors=true --ssl-protocol=tlsv1 testBot.js
Page title is Login
*** testBot.js
var page = require('webpage').create();
var url = 'https://www.some-https-site/login/';
page.onConsoleMessage = function(msg) {
console.log('Page title is ' + msg);
};
page.open(url, function(status) {
page.evaluate(function() {
console.log(document.title);
});
phantom.exit();
});
此代码相当混乱,但当我将站点切换回 HTTP 而不是 HTTPS 时,它运行良好。
// Main nightmare call
// Code is quite messy, i know.
new Nightmare({ignoreSslErrors : 'true', sslProtocol : 'tlsv1'})
.useragent('chrome')
.use(openpage())
.evaluate(function() {
return document.title;
},function(title) {
// console.info('FALSE = not logged in');
console.info('title : ' + title);
if (title === 'Login'){
console.info('false');
loginCheckBit = false;
}else if (title === 'Print Invoice'){
loginCheckBit = true;
console.info('true');
}else{
console.info('#########################################');
console.info(' NEED TO TROUBLESHOOT scraper looks lost');
console.info('#########################################');
}
})
.run(function(err, nightmare){
if (err){
console.info('err : ' + err);
}
if (!loginCheckBit){
new Nightmare({ignoreSslErrors : 'true', sslProtocol : 'tlsv1'})
.use(login(user))
.use(screenshot())
.evaluate(function() {
return document.title;
},function(title) {
console.info('#################');
console.info('title : ' + title);
makePDF();
})
.run(function(err, nightmare){
if (err){
console.info('err : ' + err);
}
});
}else{
new Nightmare({ignoreSslErrors : 'true', sslProtocol : 'tlsv1'})
.use(openpage())
.use(screenshot())
.evaluate(function() {
return document.title;
},function(title) {
console.info('################');
console.info('inside 2nd eval');
console.info('title : ' + title);
makePDF();
})
.run(function(err, nightmare){
if (err){
console.info('err : ' + err);
}
});
}
});
function openpage(user){
console.info('============ BOT URL CALL =============');
console.info(rootURL + '/account/invoices/'+req.params.id+'/printerFriendly/');
console.info('====================================');
return function(nightmare){
nightmare
.goto(rootURL + '/account/invoices/'+req.params.id+'/printerFriendly/')
.wait();
};
}
function login(user){
return function(nightmare){
nightmare
.goto(rootURL + '/account/invoices/'+req.params.id+'/printerFriendly/')
.type("input[name='username']", user.name)
.type("input[name='password']", user.pass)
.click('.btn-login')
.wait();
};
}
我知道 HTTPS 在调用 'login' 函数时失败并且无法找到输入框:
.type("input[name='username']", user.name)
.type("input[name='password']", user.pass)
Nightmare 将 return 输入框错误,页面标题为空。它应该是:"login" 或 'Print Invoice',具体取决于 'bot' 是否已登录。
关于 'tlsv1' 以下线程让我走上了正确的方向: 但我无法让它在 Nightmare 中工作。
好的,所以我的主机在 Ubuntu 12.04 上配置了我,就像一般升级一样,我要求他们重新配置 Ubuntu 14.04。我 运行 我的 install/deploy 脚本。所以完全相同的代码库。现在可以使用了!
我的脚本以完全相同的方式安装了完全相同版本的 PhantomJS 和 NightmareJS。所以我现在真的不知道问题出在哪里。但是我上面的代码是正确的并且可以正常工作,以防其他人正在尝试类似的事情并且有疑问。
[ phantomjs -v 1.9.7 ] 与 噩梦: https://github.com/segmentio/nightmare
通过那个使用超时选项的示例,我已经尽可能地设置了选项:
new Nightmare({ignoreSslErrors : 'true', sslProtocol : 'tlsv1'})
也试过
new Nightmare({ignoreSslErrors : true, sslProtocol : 'tlsv1'})
它不会打开 https 页面。
如果我直接使用 phantomjs 来点击同一个页面,它工作正常:
phantomjs --ignore-ssl-errors=true --ssl-protocol=tlsv1 testBot.js
Page title is Login
*** testBot.js
var page = require('webpage').create();
var url = 'https://www.some-https-site/login/';
page.onConsoleMessage = function(msg) {
console.log('Page title is ' + msg);
};
page.open(url, function(status) {
page.evaluate(function() {
console.log(document.title);
});
phantom.exit();
});
此代码相当混乱,但当我将站点切换回 HTTP 而不是 HTTPS 时,它运行良好。
// Main nightmare call
// Code is quite messy, i know.
new Nightmare({ignoreSslErrors : 'true', sslProtocol : 'tlsv1'})
.useragent('chrome')
.use(openpage())
.evaluate(function() {
return document.title;
},function(title) {
// console.info('FALSE = not logged in');
console.info('title : ' + title);
if (title === 'Login'){
console.info('false');
loginCheckBit = false;
}else if (title === 'Print Invoice'){
loginCheckBit = true;
console.info('true');
}else{
console.info('#########################################');
console.info(' NEED TO TROUBLESHOOT scraper looks lost');
console.info('#########################################');
}
})
.run(function(err, nightmare){
if (err){
console.info('err : ' + err);
}
if (!loginCheckBit){
new Nightmare({ignoreSslErrors : 'true', sslProtocol : 'tlsv1'})
.use(login(user))
.use(screenshot())
.evaluate(function() {
return document.title;
},function(title) {
console.info('#################');
console.info('title : ' + title);
makePDF();
})
.run(function(err, nightmare){
if (err){
console.info('err : ' + err);
}
});
}else{
new Nightmare({ignoreSslErrors : 'true', sslProtocol : 'tlsv1'})
.use(openpage())
.use(screenshot())
.evaluate(function() {
return document.title;
},function(title) {
console.info('################');
console.info('inside 2nd eval');
console.info('title : ' + title);
makePDF();
})
.run(function(err, nightmare){
if (err){
console.info('err : ' + err);
}
});
}
});
function openpage(user){
console.info('============ BOT URL CALL =============');
console.info(rootURL + '/account/invoices/'+req.params.id+'/printerFriendly/');
console.info('====================================');
return function(nightmare){
nightmare
.goto(rootURL + '/account/invoices/'+req.params.id+'/printerFriendly/')
.wait();
};
}
function login(user){
return function(nightmare){
nightmare
.goto(rootURL + '/account/invoices/'+req.params.id+'/printerFriendly/')
.type("input[name='username']", user.name)
.type("input[name='password']", user.pass)
.click('.btn-login')
.wait();
};
}
我知道 HTTPS 在调用 'login' 函数时失败并且无法找到输入框:
.type("input[name='username']", user.name)
.type("input[name='password']", user.pass)
Nightmare 将 return 输入框错误,页面标题为空。它应该是:"login" 或 'Print Invoice',具体取决于 'bot' 是否已登录。
关于 'tlsv1' 以下线程让我走上了正确的方向: 但我无法让它在 Nightmare 中工作。
好的,所以我的主机在 Ubuntu 12.04 上配置了我,就像一般升级一样,我要求他们重新配置 Ubuntu 14.04。我 运行 我的 install/deploy 脚本。所以完全相同的代码库。现在可以使用了!
我的脚本以完全相同的方式安装了完全相同版本的 PhantomJS 和 NightmareJS。所以我现在真的不知道问题出在哪里。但是我上面的代码是正确的并且可以正常工作,以防其他人正在尝试类似的事情并且有疑问。