python xlsxwriter 从单元格中提取值

python xlsxwriter extract value from cell

是否可以提取我写入 xlsxwriter.worksheet 的数据?

import xlsxwriter

output = "test.xlsx"
workbook = xlsxwriter.Workbook(output)
worksheet = workbook.add_worksheet()


worksheet.write(0, 0, 'top left')
if conditional:
    worksheet.write(1, 1, 'bottom right')

for row in range(2):
  for col in range(2):
    # Now how can I check if a value was written at this coordinate?
    # something like worksheet.get_value_at_row_col(row, col)

workbook.close()

Is it possible to extract data that I've written to a xlsxwriter.worksheet?

没有。 XlsxWriter 是只写的。如果您需要跟踪数据,则需要在 XlsxWriter 之外用自己的代码来完成。

Is it possible to extract data that I've written to a xlsxwriter.worksheet?

是的。尽管 XlsxWriter 是只写的,但它会将 table 值存储在内部结构中,并且仅在执行 workbook.close() 时才将它们写入文件。

每个工作表都有一个 table 属性。它是一个字典,包含所有填充行的条目(从 0 开始的行号是键)。这些条目又是字典,包含行内所有填充单元格的条目(从 0 开始的列号是键)。

因此,table[row][col] 将在所需位置为您提供条目(但只有在有条目的情况下才会失败)。

请注意,这些条目仍然不是您要查找的文本、数字或公式,而是命名的元组,其中还包含单元格格式。您可以键入检查条目并根据其性质提取内容。以下是 type(entry) 的可能结果和可访问的命名元组的字段:

  • xlsxwriter.worksheet.cell_string_tuple: 字符串,格式
  • xlsxwriter.worksheet.cell_number_tuple: 数字, 格式
  • xlsxwriter.worksheet.cell_blank_tuple: 格式
  • xlsxwriter.worksheet.cell_boolean_tuple:布尔值,格式
  • xlsxwriter.worksheet.cell_formula_tuple:公式、格式、数值
  • xlsxwriter.worksheet.cell_arformula_tuple:公式、格式、数值、范围

对于数字、布尔值和公式,可以通过读取命名元组的相应字段来访问内容。

对于数组公式,内容仅出现在输出范围的左上角单元格中,而其余单元格由具有 0 值的数字条目表示。

对于字符串,情况比较复杂,因为Excel的存储概念有一个共享的字符串table,而单独的单元格条目只指向这个[=55=的一个索引].共享字符串 table 可以作为工作表的 str_table.string_table 属性访问。它是一个字典,其中键是字符串,值是关联的索引。为了通过索引访问字符串,您可以从字典中生成一个排序列表,如下所示:

shared_strings = sorted(worksheet.str_table.string_table, key=worksheet.str_table.string_table.get)

我从上面扩展了您的示例以包括所有解释的功能。现在看起来像这样:

import xlsxwriter

output = "test.xlsx"
workbook = xlsxwriter.Workbook(output)
worksheet = workbook.add_worksheet()

worksheet.write(0, 0, 'top left')
worksheet.write(0, 1, 42)
worksheet.write(0, 2, None)
worksheet.write(2, 1, True)
worksheet.write(2, 2, '=SUM(X5:Y7)')
worksheet.write_array_formula(2,3,3,4, '{=TREND(X5:X7,Y5:Y7)}')
worksheet.write(4,0, 'more text')
worksheet.write(4,1, 'even more text')
worksheet.write(4,2, 'more text')
worksheet.write(4,3, 'more text')

for row in range(5):
  row_dict = worksheet.table.get(row, None)
  for col in range(5):
    if row_dict != None:
      col_entry = row_dict.get(col, None)
    else:
      col_entry = None
    print(row,col,col_entry)

shared_strings = sorted(worksheet.str_table.string_table, key=worksheet.str_table.string_table.get)

print()
if type(worksheet.table[0][0]) == xlsxwriter.worksheet.cell_string_tuple:
  print(shared_strings[worksheet.table[0][0].string])

# type checking omitted for the rest...
print(worksheet.table[0][1].number)
print(bool(worksheet.table[2][1].boolean))
print('='+worksheet.table[2][2].formula)
print('{='+worksheet.table[2][3].formula+'}')

workbook.close()