如何使用 css 或 xpath 选择器拒绝指定 HTML 标签

How to reject specify HTML tags by using css or xpath selector

我想使用 css 或 xpath 选择器删除 stylescript 标签及其内容。

这是一个例子HTML:

<html>
  <head>
    <title>test</title>
    <style>
      // style
    </style>
    <script>
      /* some script */
    </script>
  </head>
  <body>
    <p>text</p>
    <script>
      /* some script */
    </script>
    <div>foo</div>
  </body>
</html>

我想要这样的 HTML:

<html>
  <head>
    <title>test</title>
  </head>
  <body>
    <p>text</p>
    <div>foo</div>
  </body>
</html>

我以为我可以得到 HTML 不包含此代码的 <script> 标签,但不知何故代码只复制了 HTML.

doc = Nokogiri::HTML(open("foo.text"))
doc.css(":not(script)").to_html

如何启用我想要的行为?

试试这些行:

doc.search('.//style').remove
doc.search('.//script').remove

更简单的是:

doc.search('style,script').remove