如何防止 LibreOfficeCalc 将 CSV 保存为 text/html?

How to prevent LibreOfficeCalc from saving CSV as text/html?

我正在尝试将 CSV 文件上传到 WordPress(WooCommerce 产品导入程序),但它一直显示“出于安全原因不允许使用文件类型”。问题是,我通过将一个较大的文件分成三个来自己创建文件。它接受了大文件(但后来由于其他原因失败了),并且还接受了三个文件中的第一个。但其他两个不是。

底线:一旦我用 LibreOfficeCalc 保存文件,mime 类型就会从 text/plain 变为 text/html(使用 file --mime-type myfile-2.csv 测试)——因为它主要有一个列Description 有很多 HTML 文本。

我也无法通过添加随机 non-HTML 列来影响 mimetype。

我可以在“编辑过滤器设置”下更改定界符和文件编码,但不能更改 mimetype。其他地方是否有复选框,或者我可以在某些 ini 文件中设置的配置来防止这种行为?


或者,如何将 bash 中的 mimetype 从一种转换为另一种?答案here并没有太大帮助,因为我无法修改上传的请求header,而且gs似乎是针对PDF的解决方案。

# Ubuntu 18.04.5.
$ bash --version
> GNU bash, version 4.4.20(1)-release (x86_64-pc-linux-gnu)

示例数据:

"wpid";"_SKU";"_name";"Description"
166678;23009;"CSM-AR9281X-99F-V1A";"Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nullam quis accumsan augue. Sed fermentum, eros ac ullamcorper auctor, nunc erat sodales mauris, ut pretium ante odio et ex. Orci varius natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Sed metus sem, varius nec odio ut, vehicula ornare dolor. Proin feugiat eros vitae odio pharetra, sed suscipit augue accumsan. Sed ipsum lorem, vestibulum sed ex eu, mattis accumsan tellus. Sed interdum, sem ac molestie aliquam, nunc mi ullamcorper massa, vitae viverra metus nisi at ante. Donec id nisi lacus. Sed aliquet, ex quis interdum efficitur, nisi risus facilisis massa, in tristique libero turpis ac tortor. Etiam auctor turpis nec sodales placerat. Aenean auctor interdum felis.
<br><br>
Maecenas vel arcu quis magna suscipit tempor id et metus. Duis volutpat fringilla sem. Nulla pharetra, turpis maximus tristique fermentum, arcu arcu volutpat diam, a imperdiet turpis ante et libero. Nulla nisl elit, suscipit ac luctus id, laoreet a elit. Donec fringilla turpis id accumsan fermentum.<br>
<a href=""www.cliens.com/en/embedded-vision/cliens-sensor-modules/"">Morbi ultricies egestas commodo </a>
<br>
<p><a href=""https://support.cliens.com/en/support/solutions/48000450070"" target=""_blank""><img id=""tinymce-editor-image-8a100d4d-0c23-4a95-9a21-3c8d10050ce8"" class=""tinymce-editor-image tinymce-editor-image-8a100d4d-0c23-4a95-9a21-3c8d10050ce8"" src=""https://cliens.com/media/image/a2/8d/42/Fusce_blandit_consectetur_mattis.png"" alt=""Fusce_blandit_consectetur_mattis"" data-src=""media/image/Fusce_blandit_consectetur_mattis.png"" /></a></p>
"

更新: 我既无法将其保存为 而不是 通过 copy-pasting-saving 在 Sublime-Text 中保存为 text/html,也无法在 Google 电子表格中保存(然后导出).他们也保存为 text/html。也许它与 LibreOfficeCalc 的关系并不像我想象的那么大。

鉴于 - 无论出于何种原因 - 我可以将大文件保存为 text/plain 只要我不删除任何行,并且我只想更新现有产品,我可以“解决”通过使不导入的行不可导入来解决此问题:我将 ID 更改为不存在的 ID。

我希望这段奇怪旅程的记录有朝一日能对任何人有所帮助。

处理此问题的另一种方法是在具有 HTML 标记的列之前创建一个新列,并为每个单元格填充明确没有 HTML 的 random blindcopy text标签;非常非常长的文字,如有必要。

我想,如果没有这个解决方法,其他单元格的内容太短,无法使其中包含 HTML 的一列 not 支配文件.