您能否格式化 pandas 整数以供显示,例如 `pd.options.display.float_format` 用于浮点数?

Can you format pandas integers for display, like `pd.options.display.float_format` for floats?

我看过 this and this 关于格式化 浮点数 数字以便在 pandas 中显示,但我有兴趣为 pandas 做同样的事情整数

现在,我有:

pd.options.display.float_format = '{:,.2f}'.format

这适用于我数据中的浮点数,但会在转换为浮点数的整数上留下烦人的尾随零,或者我将使用未使用逗号格式化的普通整数。

pandas 文档提到了一个 SeriesFormatter class,我无法找到关于它的任何信息。

或者,如果有一种方法可以编写单个字符串格式化程序,将浮点数格式化为 '{:,.2f}' 并将尾随小数点为零的浮点数格式化为 '{:,d}',那也行得通。

你可以猴子补丁 pandas.io.formats.format.IntArrayFormatter:

import contextlib
import numpy as np
import pandas as pd
import pandas.io.formats.format as pf
np.random.seed(2015)

@contextlib.contextmanager
def custom_formatting():
    orig_float_format = pd.options.display.float_format
    orig_int_format = pf.IntArrayFormatter

    pd.options.display.float_format = '{:0,.2f}'.format
    class IntArrayFormatter(pf.GenericArrayFormatter):
        def _format_strings(self):
            formatter = self.formatter or '{:,d}'.format
            fmt_values = [formatter(x) for x in self.values]
            return fmt_values
    pf.IntArrayFormatter = IntArrayFormatter
    yield
    pd.options.display.float_format = orig_float_format
    pf.IntArrayFormatter = orig_int_format


df = pd.DataFrame(np.random.randint(10000, size=(5,3)), columns=list('ABC'))
df['D'] = np.random.random(df.shape[0])*10000

with custom_formatting():
    print(df)

产量

      A     B     C        D
0 2,658 2,828 4,540 8,961.77
1 9,506 2,734 9,805 2,221.86
2 3,765 4,152 4,583 2,011.82
3 5,244 5,395 7,485 8,656.08
4 9,107 6,033 5,998 2,942.53

with-statement 之外时:

print(df)

产量

      A     B     C            D
0  2658  2828  4540  8961.765260
1  9506  2734  9805  2221.864779
2  3765  4152  4583  2011.823701
3  5244  5395  7485  8656.075610
4  9107  6033  5998  2942.530551

Jupyter notebooks 的另一种选择是使用 df.style.format('{:,}'),但据我所知它只适用于单个数据帧,所以你每次都必须调用它:

table.style.format('{:,}')
          col1       col2
0s   9,246,452  6,669,310
>0   2,513,002  5,090,144

table
       col1     col2
0s  9246452  6669310
>0  2513002  5090144

Styling — pandas 1.1.2 documentation

从 Pandas 1.3.0 开始,您可以指定 df.style.format(thousands=',') 在浮点数、复数和整数中使用逗号分隔千位。

参见:https://pandas.pydata.org/docs/reference/api/pandas.io.formats.style.Styler.format.html