删除 Pandas DataFrame.to_string 插入的列之间的自动两个空格

Question

我正在寻找 remove/turn 关闭 df.to_string 自动创建的列之间的 2 个空格的解决方案。

示例：

from pandas import DataFrame

df = DataFrame()
df = df.append({'a':'12345', 'b': '12345'})
df.to_string(index=False, header=False)
'12345  1235'

为清楚起见，结果是：“12345..12345”，其中点代表实际空间。

我已经尝试了 pandas.set_option and pandas.to_string 文档。

编辑：上面的例子过于简化了。我正在使用一个现有的 df，它到处都是空格，输出文本文件由另一个基于每行字符宽度的黑盒程序使用。我已经想出如何使用格式化程序重新格式化列，并确保我的列不会被默认 pandas 截断，所以我已经完成了 90%（减去这些自动空格）。仅供参考，这里有一些关于 to_string() 格式化和数据截断的好链接：

https://github.com/pandas-dev/pandas/issues/9784

感谢您的帮助！

Answer 1

您可以使用 pd.Series.str.cat 方法，它接受 sep 关键字参数。默认情况下 sep 设置为 ''，因此值之间没有分隔。以下是文档：https://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.str.cat.html

您还可以使用 pd.Series.str.strip 从每个值中删除任何前导或尾随空格。以下是文档：https://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.str.strip.html

这是一个基于您所拥有的示例：

df = pd.DataFrame({'a': ['12345'], 'b': ['12345']})
df.iloc[0].fillna('').str.strip().str.cat(sep=' ')

请注意，如果有任何空值，则需要 fillna('')。

Answer 2

我也遇到了同样的问题。 to_string() 中有一个 justify 选项，在这种情况下应该会有所帮助。但我最终还是用老方法做了：

[row['a']+ row['b'] for index, row in df.iterrows()]

删除 Pandas DataFrame.to_string 插入的列之间的自动两个空格

Remove the automatic two spaces between columns that Pandas DataFrame.to_string inserts

python

formatting

dataframe

pandas

display