如何使用 css 或 xpath 选择器拒绝指定 HTML 标签
How to reject specify HTML tags by using css or xpath selector
我想使用 css 或 xpath 选择器删除 style
和 script
标签及其内容。
这是一个例子HTML:
<html>
<head>
<title>test</title>
<style>
// style
</style>
<script>
/* some script */
</script>
</head>
<body>
<p>text</p>
<script>
/* some script */
</script>
<div>foo</div>
</body>
</html>
我想要这样的 HTML:
<html>
<head>
<title>test</title>
</head>
<body>
<p>text</p>
<div>foo</div>
</body>
</html>
我以为我可以得到 HTML 不包含此代码的 <script>
标签,但不知何故代码只复制了 HTML.
doc = Nokogiri::HTML(open("foo.text"))
doc.css(":not(script)").to_html
如何启用我想要的行为?
试试这些行:
doc.search('.//style').remove
doc.search('.//script').remove
更简单的是:
doc.search('style,script').remove
我想使用 css 或 xpath 选择器删除 style
和 script
标签及其内容。
这是一个例子HTML:
<html>
<head>
<title>test</title>
<style>
// style
</style>
<script>
/* some script */
</script>
</head>
<body>
<p>text</p>
<script>
/* some script */
</script>
<div>foo</div>
</body>
</html>
我想要这样的 HTML:
<html>
<head>
<title>test</title>
</head>
<body>
<p>text</p>
<div>foo</div>
</body>
</html>
我以为我可以得到 HTML 不包含此代码的 <script>
标签,但不知何故代码只复制了 HTML.
doc = Nokogiri::HTML(open("foo.text"))
doc.css(":not(script)").to_html
如何启用我想要的行为?
试试这些行:
doc.search('.//style').remove
doc.search('.//script').remove
更简单的是:
doc.search('style,script').remove