创建一个 xlsx 文件的副本,其中删除了所有公式

create a copy of xlsx file having all formula's within removed

无法使用 xlrd 复制 xlsx 和 xlsm 文件,因为它说 "formatting info= True" 尚未实现并且 openpyxl 在执行以下操作时内存不足:

import xlrd
from xlutils.copy import copy
from openpyxl import load_workbook

if file_format == 'xls':
        input_file=xlrd.open_workbook(input_file_location,formatting_info=True)
        wb = copy(input_file)
        wb.save(destination_file)
if file_format == 'xlsx' or file_format == 'xlsm' :
        input_file  =  load_workbook(input_file_location,data_only=True)
        input_file.save(destination_file)

如果您只想复制文件,那么只需使用 shutil 即可。还有一些 openpyxl 不支持的东西,比如会丢失的图像和图表。而且,正如您所看到的,内存是一个问题。每个单元格使用大约 45 kB 的内存。

openpyxl 文档非常清楚打开工作簿时使用的不同选项:data_only只读取任何公式的结果并忽略公式。

如果要复制工作表,请参阅 https://bitbucket.org/openpyxl/openpyxl/issue/171/copy-worksheet-function

否则你可以使用两个工作簿,一个是只读模式,另一个是只写模式。但是如果要复制,最好在文件系统中完成。

如果您只想将值从一个工作簿复制到另一个工作簿,则可以组合只读和只写模式以减少内存占用。下面的伪代码应该给你一个基础。

wb1 = load_workbook("file.xlsx", read_only=True, data_only=True)
wb2 = Workbook(write_only=True)
for ws1 in wb1:
    ws2 = wb2.create_sheet(ws1.title)
    for r1 in ws1:
        ws2.append(r1) # this might need unpacking to use values
wb2.save("copy.xlsx")