使用 import.io 时需要在文本块标记中保留 <br>

Need to keep <br> in text block tags while using import.io

想做一些相对简单的事情,我正在抓取到目前为止我没有遇到问题的文本,但我需要保留 <br> 标签,因为白色 space 分析很重要数据集的一部分。

有没有办法保留 <br> 标签,以便我以后可以将它们变成 \n\r

示例:

<p>
<span>Some text.</br></span>
<a>Some more text.<br></a>
<span>Some more more text.<br></span>
</p>

我需要:Some text.<br>Some more text.<br>Some more more text.<br>

现在我得到:Some text. Some more text. Some more more text.

建议?

唯一的方法是获取您选择的 html 格式,您所要做的就是将列类型从 Text 更改为 HTML ,也没有办法只获取文本 + <br>.