openoffice calc - 换行符导致单元格中出现重复值 (pandas/openpyxl)
openoffice calc - newline causes duplicate value in cells (pandas/openpyxl)
有谁知道如何解决 OpenOffice Calc 无法正确处理单元格中的新行的问题?
我有一个 python 脚本,它通过 pandas 使用 openpyxl 动态生成 excel 工作簿。
该脚本工作正常,但是当我在 OpenOffice 中查看包含换行符的单元格时,所有值都重复了多次。如果我使用 Microsoft Excel 查看器打开同一个文件,所有内容都会正确显示,如果我使用换行符以外的字符(例如逗号、# 等),它也可以在两者中正常显示。
我有一个解决方法可以进入 excel 并使用宏替换随机字符,但我想尽可能避免这种情况,因为该过程确实需要完全自动化。也因为文件将由另一个内部工具处理,我确实需要用新行处理这些单元格,我不能更改字符。
我也尝试过使用 chr(10) and/or chr(13) 但在前一种情况下,它只是在输出中被 '\n' 替换为预期的结果。
我目前使用的代码类似于:
test_list = []
for x in range(1,18):
test_list.append([
"value1",
"\n".join(['element1', 'element2', 'element3']),
"value3"
])
data_df = pd.DataFrame(test_list)
fn = r'/path/to/excel/file.xlsx'
writer = pd.ExcelWriter(fn, engine='xlsxwriter')
data_df.to_excel(writer, sheet_name='Data', index=False, header=0)
workbook = writer.book
worksheet = writer.sheets['Data']
worksheet.set_column('A:ZZ',50,
workbook.add_format({'text_wrap': True}))
writer.save()
Element 数据发生的情况是它在 OpenOffice Calc 单元格中显示如下:
奇怪的是最后一项似乎是正确的
作为列表或通过 DataFrame.head() 查看的相同数据显示正常:
pprint(test_list)
[['value1', 'element1\nelement2\nelement3', 'value3'],
['value1', 'element1\nelement2\nelement3', 'value3'],
['value1', 'element1\nelement2\nelement3', 'value3'],
['value1', 'element1\nelement2\nelement3', 'value3'],
['value1', 'element1\nelement2\nelement3', 'value3'],
['value1', 'element1\nelement2\nelement3', 'value3'],
...
['value1', 'element1\nelement2\nelement3', 'value3']]
data_df.head(18):
0 1 2
0 value1 element1\nelement2\nelement3 value3
1 value1 element1\nelement2\nelement3 value3
2 value1 element1\nelement2\nelement3 value3
...
15 value1 element1\nelement2\nelement3 value3
16 value1 element1\nelement2\nelement3 value3
它只是传递给 openpyxl 库并在 OpenOffice 中查看。
谢谢
当我 运行 你的例子与最近的 Pandas 和 XlsxWriter 我在 Excel:
中得到预期的输出
但是,在这种情况下 Excel 会自动调整第 2 行的高度以进行补偿。这在 OpenOffice 中可能不会发生。
在这种情况下,您可以像这样明确设置它:
worksheet.set_row(1, 45)
我在 Windows:
上使用 OpenOffice 4.1.2 时代码运行良好
对于此屏幕截图,我双击第二行的底部将其展开。在此之前,它只是显示 element3
和一个红色三角形。但这似乎与您描述的行为不同。
编辑:
好的,我现在可以确认问题了。如您所说,它与神秘的 18 件物品一起出现。好像是OpenOffice的bug,因为解压file.xlsx
.
看到的XML个文件差别不大
我还尝试将 CR 和 LF 直接添加到 XML 文件中,但这只会导致:
这给我们留下了三个解决方案:
- 改用 LibreOffice,没有这个问题(已测试 LO 5.1.0.3)。
- Report the bug等待新版本
- 使用 OpenOffice 的首选
.ods
格式,而不是 MS Office 的首选格式。
有谁知道如何解决 OpenOffice Calc 无法正确处理单元格中的新行的问题?
我有一个 python 脚本,它通过 pandas 使用 openpyxl 动态生成 excel 工作簿。
该脚本工作正常,但是当我在 OpenOffice 中查看包含换行符的单元格时,所有值都重复了多次。如果我使用 Microsoft Excel 查看器打开同一个文件,所有内容都会正确显示,如果我使用换行符以外的字符(例如逗号、# 等),它也可以在两者中正常显示。
我有一个解决方法可以进入 excel 并使用宏替换随机字符,但我想尽可能避免这种情况,因为该过程确实需要完全自动化。也因为文件将由另一个内部工具处理,我确实需要用新行处理这些单元格,我不能更改字符。
我也尝试过使用 chr(10) and/or chr(13) 但在前一种情况下,它只是在输出中被 '\n' 替换为预期的结果。
我目前使用的代码类似于:
test_list = []
for x in range(1,18):
test_list.append([
"value1",
"\n".join(['element1', 'element2', 'element3']),
"value3"
])
data_df = pd.DataFrame(test_list)
fn = r'/path/to/excel/file.xlsx'
writer = pd.ExcelWriter(fn, engine='xlsxwriter')
data_df.to_excel(writer, sheet_name='Data', index=False, header=0)
workbook = writer.book
worksheet = writer.sheets['Data']
worksheet.set_column('A:ZZ',50,
workbook.add_format({'text_wrap': True}))
writer.save()
Element 数据发生的情况是它在 OpenOffice Calc 单元格中显示如下:
奇怪的是最后一项似乎是正确的
作为列表或通过 DataFrame.head() 查看的相同数据显示正常:
pprint(test_list)
[['value1', 'element1\nelement2\nelement3', 'value3'],
['value1', 'element1\nelement2\nelement3', 'value3'],
['value1', 'element1\nelement2\nelement3', 'value3'],
['value1', 'element1\nelement2\nelement3', 'value3'],
['value1', 'element1\nelement2\nelement3', 'value3'],
['value1', 'element1\nelement2\nelement3', 'value3'],
...
['value1', 'element1\nelement2\nelement3', 'value3']]
data_df.head(18):
0 1 2
0 value1 element1\nelement2\nelement3 value3
1 value1 element1\nelement2\nelement3 value3
2 value1 element1\nelement2\nelement3 value3
...
15 value1 element1\nelement2\nelement3 value3
16 value1 element1\nelement2\nelement3 value3
它只是传递给 openpyxl 库并在 OpenOffice 中查看。
谢谢
当我 运行 你的例子与最近的 Pandas 和 XlsxWriter 我在 Excel:
中得到预期的输出但是,在这种情况下 Excel 会自动调整第 2 行的高度以进行补偿。这在 OpenOffice 中可能不会发生。
在这种情况下,您可以像这样明确设置它:
worksheet.set_row(1, 45)
我在 Windows:
上使用 OpenOffice 4.1.2 时代码运行良好对于此屏幕截图,我双击第二行的底部将其展开。在此之前,它只是显示 element3
和一个红色三角形。但这似乎与您描述的行为不同。
编辑:
好的,我现在可以确认问题了。如您所说,它与神秘的 18 件物品一起出现。好像是OpenOffice的bug,因为解压file.xlsx
.
我还尝试将 CR 和 LF 直接添加到 XML 文件中,但这只会导致:
这给我们留下了三个解决方案:
- 改用 LibreOffice,没有这个问题(已测试 LO 5.1.0.3)。
- Report the bug等待新版本
- 使用 OpenOffice 的首选
.ods
格式,而不是 MS Office 的首选格式。