使用 jQuery / CheerioJS 抓取 HTML 评论?
Scraping HTML Comments using jQuery / CheerioJS?
我这里有这段 HTML 代码:https://pastebin.com/wbQwys8R
我的目标是解析 HTML 评论,以便将它们放入字典中。这段代码在这里
$("body").find("div.cl-entry").each((currIndex, currElement) => {
/* Get the comments from each run */
})
允许我找到所有 HTML,这些 HTML 给我上面的一小段 HTML 代码(pastebin link),但我如何解析 HTML评论自己?
访问 div 的 .children
属性 将允许您使用 Cheerio 遍历子项 ,包括评论 。例如:
const cheerio = require('cheerio');
const $ = cheerio.load(`
<div class='cl-info'>
<!-- updated=Saturday, 13-Mar-2021 06:46:41 GMT -->
<!-- id=985dad7f1491 -->
<!-- status=active -->
<!-- offline=no -->
<!-- name=0-30 Kiwi-SDR Flornes, Norway LB8PI -->
<!-- sdr_hw=KiwiSDR v1.438 DRM -->
</div>`);
for (const child of $('.cl-info')[0].children) {
if (child.type === 'comment') {
console.log(child.data);
}
}
导致记录以下内容:
updated=Saturday, 13-Mar-2021 06:46:41 GMT
id=985dad7f1491
status=active
offline=no
name=0-30 Kiwi-SDR Flornes, Norway LB8PI
sdr_hw=KiwiSDR v1.438 � DRM
我这里有这段 HTML 代码:https://pastebin.com/wbQwys8R 我的目标是解析 HTML 评论,以便将它们放入字典中。这段代码在这里
$("body").find("div.cl-entry").each((currIndex, currElement) => {
/* Get the comments from each run */
})
允许我找到所有 HTML,这些 HTML 给我上面的一小段 HTML 代码(pastebin link),但我如何解析 HTML评论自己?
访问 div 的 .children
属性 将允许您使用 Cheerio 遍历子项 ,包括评论 。例如:
const cheerio = require('cheerio');
const $ = cheerio.load(`
<div class='cl-info'>
<!-- updated=Saturday, 13-Mar-2021 06:46:41 GMT -->
<!-- id=985dad7f1491 -->
<!-- status=active -->
<!-- offline=no -->
<!-- name=0-30 Kiwi-SDR Flornes, Norway LB8PI -->
<!-- sdr_hw=KiwiSDR v1.438 DRM -->
</div>`);
for (const child of $('.cl-info')[0].children) {
if (child.type === 'comment') {
console.log(child.data);
}
}
导致记录以下内容:
updated=Saturday, 13-Mar-2021 06:46:41 GMT
id=985dad7f1491
status=active
offline=no
name=0-30 Kiwi-SDR Flornes, Norway LB8PI
sdr_hw=KiwiSDR v1.438 � DRM