在 Python 中用 Pandas 打开一个损坏的 .xls 文件

Open with Pandas in Python a .xls file that is corrupted

问题来了,我正在尝试从从 COGNOS 下载的文件导入 DF。在 cognos 我 select .CSV 格式但总是下载格式是 .xls

打开 .xls 文件并另存为 CVS 非常容易,但问题是文件的行数多于 excel,因此我会在此过程中丢失大量数据。此外,当我在 excel 中打开文件时,会出现文件可能已损坏的警告。

当我尝试使用 df = pd.read_excel("Time Series 2018-1.xls") 打开数据时,它显示了以下问题。

XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'\xff\xfeP\x00r\x00o\x00'

请帮助

你可以试试

  1. 更改文件名,删除空格和破折号,然后重试
  2. 跟随这个pandas官方link

我已经解决了。只需在 sublime 中打开文件并使用 UTF-8 编码保存即可。然后用 df = pd.read_csv("Prueba1.xls", sep = "\t", encoding = 'utf8') 打开它,因为正如@dougp 所说,它只是一个扩展名为 xls 的 csv 文件。

我想有一种方法可以更改 PYTHON 中的编码,但那是另一个问题。