使用 import.io 时需要在文本块标记中保留 <br>
Need to keep <br> in text block tags while using import.io
想做一些相对简单的事情,我正在抓取到目前为止我没有遇到问题的文本,但我需要保留 <br>
标签,因为白色 space 分析很重要数据集的一部分。
有没有办法保留 <br>
标签,以便我以后可以将它们变成 \n\r
。
示例:
<p>
<span>Some text.</br></span>
<a>Some more text.<br></a>
<span>Some more more text.<br></span>
</p>
我需要:Some text.<br>Some more text.<br>Some more more text.<br>
现在我得到:Some text. Some more text. Some more more text.
建议?
唯一的方法是获取您选择的 html 格式,您所要做的就是将列类型从 Text 更改为 HTML ,也没有办法只获取文本 + <br>
.
想做一些相对简单的事情,我正在抓取到目前为止我没有遇到问题的文本,但我需要保留 <br>
标签,因为白色 space 分析很重要数据集的一部分。
有没有办法保留 <br>
标签,以便我以后可以将它们变成 \n\r
。
示例:
<p>
<span>Some text.</br></span>
<a>Some more text.<br></a>
<span>Some more more text.<br></span>
</p>
我需要:Some text.<br>Some more text.<br>Some more more text.<br>
现在我得到:Some text. Some more text. Some more more text.
建议?
唯一的方法是获取您选择的 html 格式,您所要做的就是将列类型从 Text 更改为 HTML ,也没有办法只获取文本 + <br>
.