节点 x-ray 正在从 url 的 collection 抓取数据
Node x-ray crawling data from collection of url
我正在尝试抓取网站中的列表,该列表指向具有相同格式的其他页面。
我能够为所有 a 标签创建 collection,但是当我尝试访问 collection 页面时,我尝试使用它创建的密钥没有被添加在我返回的 object.
这是我尝试处理堆栈溢出的示例:
var Xray = require('x-ray');
var x = Xray();
x('http://whosebug.com/', {
title: x(['a@href'], 'title'),
}) (function(err, obj) {
console.log(obj);
});
我希望我的 obj.title 是所有 a href 页面的标题列表,而我只是得到一个空的 object。
但是,如果我尝试只使用第一个 href,那么我得到标题没问题。
var Xray = require('x-ray');
var x = Xray();
x('http://whosebug.com/', {
title: x('a@href', 'title'),
}) (function(err, obj) {
console.log(obj);
});
有没有人运行遇到过这个问题?
我 运行 以前遇到过这个问题,我的解决方案是这样的:
var Xray = require('x-ray');
var x = Xray();
x('http://whosebug.com/', {
title: x('a', [{links:'@href'}])
}) (function(err, obj) {
obj.forEach(function(links.link) {
x(links.link, "title")(function(err, data){
console.log(data) // should print the title
});
});
如果您运行遇到任何问题,请告诉我。
你可以使用 X 射线 Crawling to anoth site
var Xray = require('x-ray');
var x = Xray();
x("http://whosebug.com/", {
main: 'title',
image: x('#gbar a@href', 'title'), // follow link to google images
})(function(err, obj) {
/*
我正在尝试抓取网站中的列表,该列表指向具有相同格式的其他页面。
我能够为所有 a 标签创建 collection,但是当我尝试访问 collection 页面时,我尝试使用它创建的密钥没有被添加在我返回的 object.
这是我尝试处理堆栈溢出的示例:
var Xray = require('x-ray');
var x = Xray();
x('http://whosebug.com/', {
title: x(['a@href'], 'title'),
}) (function(err, obj) {
console.log(obj);
});
我希望我的 obj.title 是所有 a href 页面的标题列表,而我只是得到一个空的 object。
但是,如果我尝试只使用第一个 href,那么我得到标题没问题。
var Xray = require('x-ray');
var x = Xray();
x('http://whosebug.com/', {
title: x('a@href', 'title'),
}) (function(err, obj) {
console.log(obj);
});
有没有人运行遇到过这个问题?
我 运行 以前遇到过这个问题,我的解决方案是这样的:
var Xray = require('x-ray');
var x = Xray();
x('http://whosebug.com/', {
title: x('a', [{links:'@href'}])
}) (function(err, obj) {
obj.forEach(function(links.link) {
x(links.link, "title")(function(err, data){
console.log(data) // should print the title
});
});
如果您运行遇到任何问题,请告诉我。
你可以使用 X 射线 Crawling to anoth site
var Xray = require('x-ray');
var x = Xray();
x("http://whosebug.com/", {
main: 'title',
image: x('#gbar a@href', 'title'), // follow link to google images
})(function(err, obj) {
/*