cumsum 和十进制数的问题
Trouble with cumsum and decimal numbers
假设如下代码:
import numpy as np
import pandas as pd
df = pd.DataFrame({'A': np.random.randint(0, 10, 10)})
df['B'] = df['A'].diff()
x, x_diff = 1, df['B'].iloc[1:]
df['C'] = np.r_[x, x_diff].cumsum()
A B C
# 0 6 NaN 1.0
# 1 6 0.0 1.0
# 2 0 -6.0 -5.0
# 3 7 7.0 2.0
# 4 5 -2.0 0.0
# 5 3 -2.0 -2.0
# 6 3 0.0 -2.0
# 7 8 5.0 3.0
# 8 8 0.0 3.0
# 9 8 0.0 3.0
C 列如预期的那样发生了漂亮的变化。这似乎没有问题。但是,当我使用十进制数字时,它们会四舍五入为 0,最终我的起始值根本没有改变。任何想法如何防止这种情况?理论上我可以再次乘以数字,但有没有更好的方法来解决这个问题?问题演示如下:
import pandas as pd
import numpy as np
df = pd.DataFrame({'A': np.random.randint(0, 10, 10)})/100000000000000
df['B'] = df['A'].diff()
x, x_diff = 1, df['B'].iloc[1:]
df['C'] = np.r_[x, x_diff].cumsum()
# A B C
# 0 9.000000e-14 NaN 1.0
# 1 7.000000e-14 -2.000000e-14 1.0
# 2 1.000000e-14 -6.000000e-14 1.0
# 3 9.000000e-14 8.000000e-14 1.0
# 4 9.000000e-14 0.000000e+00 1.0
# 5 4.000000e-14 -5.000000e-14 1.0
# 6 6.000000e-14 2.000000e-14 1.0
# 7 9.000000e-14 3.000000e-14 1.0
# 8 7.000000e-14 -2.000000e-14 1.0
# 9 0.000000e+00 -7.000000e-14 1.0
感谢您提出的许多建议。按照 PUFF 的建议使用 0 作为起始值。 Chris 建议的 pd.set_option('precision', 16)
方法也有效。
假设如下代码:
import numpy as np
import pandas as pd
df = pd.DataFrame({'A': np.random.randint(0, 10, 10)})
df['B'] = df['A'].diff()
x, x_diff = 1, df['B'].iloc[1:]
df['C'] = np.r_[x, x_diff].cumsum()
A B C
# 0 6 NaN 1.0
# 1 6 0.0 1.0
# 2 0 -6.0 -5.0
# 3 7 7.0 2.0
# 4 5 -2.0 0.0
# 5 3 -2.0 -2.0
# 6 3 0.0 -2.0
# 7 8 5.0 3.0
# 8 8 0.0 3.0
# 9 8 0.0 3.0
C 列如预期的那样发生了漂亮的变化。这似乎没有问题。但是,当我使用十进制数字时,它们会四舍五入为 0,最终我的起始值根本没有改变。任何想法如何防止这种情况?理论上我可以再次乘以数字,但有没有更好的方法来解决这个问题?问题演示如下:
import pandas as pd
import numpy as np
df = pd.DataFrame({'A': np.random.randint(0, 10, 10)})/100000000000000
df['B'] = df['A'].diff()
x, x_diff = 1, df['B'].iloc[1:]
df['C'] = np.r_[x, x_diff].cumsum()
# A B C
# 0 9.000000e-14 NaN 1.0
# 1 7.000000e-14 -2.000000e-14 1.0
# 2 1.000000e-14 -6.000000e-14 1.0
# 3 9.000000e-14 8.000000e-14 1.0
# 4 9.000000e-14 0.000000e+00 1.0
# 5 4.000000e-14 -5.000000e-14 1.0
# 6 6.000000e-14 2.000000e-14 1.0
# 7 9.000000e-14 3.000000e-14 1.0
# 8 7.000000e-14 -2.000000e-14 1.0
# 9 0.000000e+00 -7.000000e-14 1.0
感谢您提出的许多建议。按照 PUFF 的建议使用 0 作为起始值。 Chris 建议的 pd.set_option('precision', 16)
方法也有效。