将 xls 转换为 xlsx 多余 headers
Convert xls to xlsx with excess headers
这里是初级开发人员。
目标: 使用 python,将文件类型从 xls 转换为包含干净 header.
的 xlsx
期望 header:
我的尝试:
我的第一次尝试是使用 win32com。但是,这没有用,因为我在 pip 安装时收到以下两个错误。我相信这是因为我在 Mac.
ERROR: Could not find a version that satisfies the requirement win32com (from versions: none)
ERROR: No matching distribution found for win32com
然后我按照这个 ,然而,这产生了这个错误。
xlrd.biffh.XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'<?xml ve'
我 运行 遇到的另一个问题是我的文件本身。在顶部,有 6 条额外的线需要删除。此外,我的 header 实际数据 table 混合了合并和未合并的单元格。我不确定如何解决这个问题。
任何建议都会有所帮助,在此先感谢您!
回答我问题的第二部分。仍然不确定如何接收 xls 文件。
如果我将文件转换为 CSV 文件,则使用此命令删除前几行。 skiprows 是在 df 的初始化过程中用于剪切 csv 或 xlsx 文件的顶部部分的方法。
df = pd.read_csv('file_name.csv', skiprows = 8)
这里是初级开发人员。
目标: 使用 python,将文件类型从 xls 转换为包含干净 header.
的 xlsx期望 header:
我的尝试:
我的第一次尝试是使用 win32com。但是,这没有用,因为我在 pip 安装时收到以下两个错误。我相信这是因为我在 Mac.
ERROR: Could not find a version that satisfies the requirement win32com (from versions: none)
ERROR: No matching distribution found for win32com
然后我按照这个
xlrd.biffh.XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'<?xml ve'
我 运行 遇到的另一个问题是我的文件本身。在顶部,有 6 条额外的线需要删除。此外,我的 header 实际数据 table 混合了合并和未合并的单元格。我不确定如何解决这个问题。
任何建议都会有所帮助,在此先感谢您!
回答我问题的第二部分。仍然不确定如何接收 xls 文件。
如果我将文件转换为 CSV 文件,则使用此命令删除前几行。 skiprows 是在 df 的初始化过程中用于剪切 csv 或 xlsx 文件的顶部部分的方法。
df = pd.read_csv('file_name.csv', skiprows = 8)