删除特定标签和文本 - cheeriojs

Removing specific tag and text - cheeriojs

我正在尝试删除我正在抓取的 html 文件中的一个非常具体的标签和文本。有谁知道我如何一起搜索和删除这个特定的标签和文本?

<p class="align-left">&#xA0; Scheduled Arrival Time</p>

您可以使用正则表达式将特定元素替换为其内容。 随意编辑正则表达式以满足您的需要。它选择带有 'align-left' class .

的任何 p 标签

var pattern = /<(p)\s*class\s*=\s*['\"]\s*align-left\s*['\"]\s*[^<]*<\/\s*>/g;
var content = "this is<p class=\"align-left\">&#xA0; Scheduled Arrival Time</p> a line !";
content = content.replace(pattern, "");
console.log(content);

如果您需要检查文本是否存在于特定标签中,您可以使用这个:

var pattern = /<(p)\s*class\s*=\s*['\"]\s*align-left\s*['\"]\s*>[^<]*(Arrival Time)[^<]*<\/\s*>/g;
var content = "this is<p class=\"align-left\">&#xA0; Scheduled Arrival Time</p> a line !";
var test2 = "im not <p class=\"align-left\">&#xA0; Scheduled</p> a line !";
content = content.replace(pattern, "");
console.log(content);
console.log(test2);