删除特定标签和文本 - cheeriojs
Removing specific tag and text - cheeriojs
我正在尝试删除我正在抓取的 html 文件中的一个非常具体的标签和文本。有谁知道我如何一起搜索和删除这个特定的标签和文本?
<p class="align-left">  Scheduled Arrival Time</p>
您可以使用正则表达式将特定元素替换为其内容。
随意编辑正则表达式以满足您的需要。它选择带有 'align-left' class .
的任何 p 标签
var pattern = /<(p)\s*class\s*=\s*['\"]\s*align-left\s*['\"]\s*[^<]*<\/\s*>/g;
var content = "this is<p class=\"align-left\">  Scheduled Arrival Time</p> a line !";
content = content.replace(pattern, "");
console.log(content);
如果您需要检查文本是否存在于特定标签中,您可以使用这个:
var pattern = /<(p)\s*class\s*=\s*['\"]\s*align-left\s*['\"]\s*>[^<]*(Arrival Time)[^<]*<\/\s*>/g;
var content = "this is<p class=\"align-left\">  Scheduled Arrival Time</p> a line !";
var test2 = "im not <p class=\"align-left\">  Scheduled</p> a line !";
content = content.replace(pattern, "");
console.log(content);
console.log(test2);
我正在尝试删除我正在抓取的 html 文件中的一个非常具体的标签和文本。有谁知道我如何一起搜索和删除这个特定的标签和文本?
<p class="align-left">  Scheduled Arrival Time</p>
您可以使用正则表达式将特定元素替换为其内容。 随意编辑正则表达式以满足您的需要。它选择带有 'align-left' class .
的任何 p 标签var pattern = /<(p)\s*class\s*=\s*['\"]\s*align-left\s*['\"]\s*[^<]*<\/\s*>/g;
var content = "this is<p class=\"align-left\">  Scheduled Arrival Time</p> a line !";
content = content.replace(pattern, "");
console.log(content);
如果您需要检查文本是否存在于特定标签中,您可以使用这个:
var pattern = /<(p)\s*class\s*=\s*['\"]\s*align-left\s*['\"]\s*>[^<]*(Arrival Time)[^<]*<\/\s*>/g;
var content = "this is<p class=\"align-left\">  Scheduled Arrival Time</p> a line !";
var test2 = "im not <p class=\"align-left\">  Scheduled</p> a line !";
content = content.replace(pattern, "");
console.log(content);
console.log(test2);