df.describe() 不显示大数列的所有统计信息
df.describe() does not show all stats for columns of large numbers
我正在尝试为 bignum 列表生成统计信息(以及其他内容),但它不起作用。
import pandas as pd
# example numbers
dataset = pd.DataFrame(data=[2 ** 64, 2 ** 65, 2 ** 66], columns=['bignum'])
print(dataset.describe())
它打印以下内容,但不是我想要的统计数据,例如标准偏差、平均值等,就像它处理较小数字的列表一样。
bignum
count 3
unique 3
top 36893488147419103232
freq 1
我希望它这样说:
bignum
mean ...
std ...
min ...
25% ...
50% ...
75% ...
max ...
dataset.dtypes
bignum object
dtype: object
出于某种原因,您的专栏作为对象加载到 pandas 中。解决方案是:
dataset.astype(float).describe()
bignum
count 3.000000e+00
mean 4.304240e+19
std 2.817787e+19
min 1.844674e+19
25% 2.767012e+19
50% 3.689349e+19
75% 5.534023e+19
max 7.378698e+19
将列转换为 float
以查看您想要的统计信息。
我正在尝试为 bignum 列表生成统计信息(以及其他内容),但它不起作用。
import pandas as pd
# example numbers
dataset = pd.DataFrame(data=[2 ** 64, 2 ** 65, 2 ** 66], columns=['bignum'])
print(dataset.describe())
它打印以下内容,但不是我想要的统计数据,例如标准偏差、平均值等,就像它处理较小数字的列表一样。
bignum
count 3
unique 3
top 36893488147419103232
freq 1
我希望它这样说:
bignum
mean ...
std ...
min ...
25% ...
50% ...
75% ...
max ...
dataset.dtypes
bignum object
dtype: object
出于某种原因,您的专栏作为对象加载到 pandas 中。解决方案是:
dataset.astype(float).describe()
bignum
count 3.000000e+00
mean 4.304240e+19
std 2.817787e+19
min 1.844674e+19
25% 2.767012e+19
50% 3.689349e+19
75% 5.534023e+19
max 7.378698e+19
将列转换为 float
以查看您想要的统计信息。