使用 Nokogiri 排除 HTML 标签
Exclude HTML tag with Nokogiri
我正在尝试获取 TD 标签中的所有文本,除了 <strong>
标签中的内容(可能有任意数量)。
在这个例子中我想得到:“graavis ● diakriitik (
) ↝" and "
acute accent`”:
<tr class="level2">
<td>
<strong> grave accent </strong>
<strong> (=backquote character) </strong>
graavis ● diakriitik (`) ↝
<a href="?word=sv82">acute accent</a>
</td>
</tr>
我正在尝试使用下面的代码,但它不起作用:
desc = page.css('tr td:not(strong)').text
考虑:
page.search("strong").remove
page.css(".level2 > td").text.strip
我正在尝试获取 TD 标签中的所有文本,除了 <strong>
标签中的内容(可能有任意数量)。
在这个例子中我想得到:“graavis ● diakriitik (
) ↝" and "
acute accent`”:
<tr class="level2">
<td>
<strong> grave accent </strong>
<strong> (=backquote character) </strong>
graavis ● diakriitik (`) ↝
<a href="?word=sv82">acute accent</a>
</td>
</tr>
我正在尝试使用下面的代码,但它不起作用:
desc = page.css('tr td:not(strong)').text
考虑:
page.search("strong").remove
page.css(".level2 > td").text.strip