在 Python 中用 Pandas 打开一个损坏的 .xls 文件
Open with Pandas in Python a .xls file that is corrupted
问题来了,我正在尝试从从 COGNOS 下载的文件导入 DF。在 cognos 我 select .CSV 格式但总是下载格式是 .xls
打开 .xls 文件并另存为 CVS 非常容易,但问题是文件的行数多于 excel,因此我会在此过程中丢失大量数据。此外,当我在 excel 中打开文件时,会出现文件可能已损坏的警告。
当我尝试使用 df = pd.read_excel("Time Series 2018-1.xls")
打开数据时,它显示了以下问题。
XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'\xff\xfeP\x00r\x00o\x00'
请帮助
你可以试试
- 更改文件名,删除空格和破折号,然后重试
- 跟随这个pandas官方link
我已经解决了。只需在 sublime 中打开文件并使用 UTF-8 编码保存即可。然后用 df = pd.read_csv("Prueba1.xls", sep = "\t", encoding = 'utf8')
打开它,因为正如@dougp 所说,它只是一个扩展名为 xls 的 csv 文件。
我想有一种方法可以更改 PYTHON 中的编码,但那是另一个问题。
问题来了,我正在尝试从从 COGNOS 下载的文件导入 DF。在 cognos 我 select .CSV 格式但总是下载格式是 .xls
打开 .xls 文件并另存为 CVS 非常容易,但问题是文件的行数多于 excel,因此我会在此过程中丢失大量数据。此外,当我在 excel 中打开文件时,会出现文件可能已损坏的警告。
当我尝试使用 df = pd.read_excel("Time Series 2018-1.xls")
打开数据时,它显示了以下问题。
XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'\xff\xfeP\x00r\x00o\x00'
请帮助
你可以试试
- 更改文件名,删除空格和破折号,然后重试
- 跟随这个pandas官方link
我已经解决了。只需在 sublime 中打开文件并使用 UTF-8 编码保存即可。然后用 df = pd.read_csv("Prueba1.xls", sep = "\t", encoding = 'utf8')
打开它,因为正如@dougp 所说,它只是一个扩展名为 xls 的 csv 文件。
我想有一种方法可以更改 PYTHON 中的编码,但那是另一个问题。