使用 Nokogiri 排除 HTML 标签

Question

我正在尝试获取 TD 标签中的所有文本，除了 <strong> 标签中的内容（可能有任意数量）。

在这个例子中我想得到：“graavis ● diakriitik () ↝" and "acute accent`”:

<tr class="level2">
    <td> 
        <strong> grave accent </strong> 
         <strong> (=backquote character) </strong>
         graavis ● diakriitik (`) ↝ 
         <a href="?word=sv82">acute accent</a>
    </td>
</tr>

我正在尝试使用下面的代码，但它不起作用：

desc = page.css('tr td:not(strong)').text

Answer 1

考虑：

page.search("strong").remove
page.css(".level2 > td").text.strip

使用 Nokogiri 排除 HTML 标签

Exclude HTML tag with Nokogiri

html

ruby

nokogiri