删除 Pandas DataFrame.to_string 插入的列之间的自动两个空格

Remove the automatic two spaces between columns that Pandas DataFrame.to_string inserts

我正在寻找 remove/turn 关闭 df.to_string 自动创建的列之间的 2 个空格的解决方案。

示例:

from pandas import DataFrame

df = DataFrame()
df = df.append({'a':'12345', 'b': '12345'})
df.to_string(index=False, header=False)
'12345  1235'

为清楚起见,结果是:“12345..12345”,其中点代表实际空间。

我已经尝试了 pandas.set_option and pandas.to_string 文档。

编辑:上面的例子过于简化了。我正在使用一个现有的 df,它到处都是空格,输出文本文件由另一个基于每行字符宽度的黑盒程序使用。我已经想出如何使用格式化程序重新格式化列,并确保我的列不会被默认 pandas 截断,所以我已经完成了 90%(减去这些自动空格)。 仅供参考,这里有一些关于 to_string() 格式化和数据截断的好链接:

感谢您的帮助!

您可以使用 pd.Series.str.cat 方法,它接受 sep 关键字参数。默认情况下 sep 设置为 '',因此值之间没有分隔。以下是文档:https://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.str.cat.html

您还可以使用 pd.Series.str.strip 从每个值中删除任何前导或尾随空格。以下是文档:https://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.str.strip.html

这是一个基于您所拥有的示例:

df = pd.DataFrame({'a': ['12345'], 'b': ['12345']})
df.iloc[0].fillna('').str.strip().str.cat(sep=' ')

请注意,如果有任何空值,则需要 fillna('')

我也遇到了同样的问题。 to_string() 中有一个 justify 选项,在这种情况下应该会有所帮助。但我最终还是用老方法做了:

[row['a']+ row['b'] for index, row in df.iterrows()]