您能否格式化 pandas 整数以供显示,例如 `pd.options.display.float_format` 用于浮点数?
Can you format pandas integers for display, like `pd.options.display.float_format` for floats?
我看过 this and this 关于格式化 浮点数 数字以便在 pandas 中显示,但我有兴趣为 pandas 做同样的事情整数。
现在,我有:
pd.options.display.float_format = '{:,.2f}'.format
这适用于我数据中的浮点数,但会在转换为浮点数的整数上留下烦人的尾随零,或者我将使用未使用逗号格式化的普通整数。
pandas 文档提到了一个 SeriesFormatter
class,我无法找到关于它的任何信息。
或者,如果有一种方法可以编写单个字符串格式化程序,将浮点数格式化为 '{:,.2f}'
并将尾随小数点为零的浮点数格式化为 '{:,d}'
,那也行得通。
你可以猴子补丁 pandas.io.formats.format.IntArrayFormatter
:
import contextlib
import numpy as np
import pandas as pd
import pandas.io.formats.format as pf
np.random.seed(2015)
@contextlib.contextmanager
def custom_formatting():
orig_float_format = pd.options.display.float_format
orig_int_format = pf.IntArrayFormatter
pd.options.display.float_format = '{:0,.2f}'.format
class IntArrayFormatter(pf.GenericArrayFormatter):
def _format_strings(self):
formatter = self.formatter or '{:,d}'.format
fmt_values = [formatter(x) for x in self.values]
return fmt_values
pf.IntArrayFormatter = IntArrayFormatter
yield
pd.options.display.float_format = orig_float_format
pf.IntArrayFormatter = orig_int_format
df = pd.DataFrame(np.random.randint(10000, size=(5,3)), columns=list('ABC'))
df['D'] = np.random.random(df.shape[0])*10000
with custom_formatting():
print(df)
产量
A B C D
0 2,658 2,828 4,540 8,961.77
1 9,506 2,734 9,805 2,221.86
2 3,765 4,152 4,583 2,011.82
3 5,244 5,395 7,485 8,656.08
4 9,107 6,033 5,998 2,942.53
在 with-statement
之外时:
print(df)
产量
A B C D
0 2658 2828 4540 8961.765260
1 9506 2734 9805 2221.864779
2 3765 4152 4583 2011.823701
3 5244 5395 7485 8656.075610
4 9107 6033 5998 2942.530551
Jupyter notebooks 的另一种选择是使用 df.style.format('{:,}')
,但据我所知它只适用于单个数据帧,所以你每次都必须调用它:
table.style.format('{:,}')
col1 col2
0s 9,246,452 6,669,310
>0 2,513,002 5,090,144
table
col1 col2
0s 9246452 6669310
>0 2513002 5090144
从 Pandas 1.3.0 开始,您可以指定 df.style.format(thousands=',')
在浮点数、复数和整数中使用逗号分隔千位。
参见:https://pandas.pydata.org/docs/reference/api/pandas.io.formats.style.Styler.format.html。
我看过 this and this 关于格式化 浮点数 数字以便在 pandas 中显示,但我有兴趣为 pandas 做同样的事情整数。
现在,我有:
pd.options.display.float_format = '{:,.2f}'.format
这适用于我数据中的浮点数,但会在转换为浮点数的整数上留下烦人的尾随零,或者我将使用未使用逗号格式化的普通整数。
pandas 文档提到了一个 SeriesFormatter
class,我无法找到关于它的任何信息。
或者,如果有一种方法可以编写单个字符串格式化程序,将浮点数格式化为 '{:,.2f}'
并将尾随小数点为零的浮点数格式化为 '{:,d}'
,那也行得通。
你可以猴子补丁 pandas.io.formats.format.IntArrayFormatter
:
import contextlib
import numpy as np
import pandas as pd
import pandas.io.formats.format as pf
np.random.seed(2015)
@contextlib.contextmanager
def custom_formatting():
orig_float_format = pd.options.display.float_format
orig_int_format = pf.IntArrayFormatter
pd.options.display.float_format = '{:0,.2f}'.format
class IntArrayFormatter(pf.GenericArrayFormatter):
def _format_strings(self):
formatter = self.formatter or '{:,d}'.format
fmt_values = [formatter(x) for x in self.values]
return fmt_values
pf.IntArrayFormatter = IntArrayFormatter
yield
pd.options.display.float_format = orig_float_format
pf.IntArrayFormatter = orig_int_format
df = pd.DataFrame(np.random.randint(10000, size=(5,3)), columns=list('ABC'))
df['D'] = np.random.random(df.shape[0])*10000
with custom_formatting():
print(df)
产量
A B C D
0 2,658 2,828 4,540 8,961.77
1 9,506 2,734 9,805 2,221.86
2 3,765 4,152 4,583 2,011.82
3 5,244 5,395 7,485 8,656.08
4 9,107 6,033 5,998 2,942.53
在 with-statement
之外时:
print(df)
产量
A B C D
0 2658 2828 4540 8961.765260
1 9506 2734 9805 2221.864779
2 3765 4152 4583 2011.823701
3 5244 5395 7485 8656.075610
4 9107 6033 5998 2942.530551
Jupyter notebooks 的另一种选择是使用 df.style.format('{:,}')
,但据我所知它只适用于单个数据帧,所以你每次都必须调用它:
table.style.format('{:,}')
col1 col2
0s 9,246,452 6,669,310
>0 2,513,002 5,090,144
table
col1 col2
0s 9246452 6669310
>0 2513002 5090144
从 Pandas 1.3.0 开始,您可以指定 df.style.format(thousands=',')
在浮点数、复数和整数中使用逗号分隔千位。
参见:https://pandas.pydata.org/docs/reference/api/pandas.io.formats.style.Styler.format.html。