Python - Pandas:如何在呈指数增长的值之间进行插值?

Python - Pandas: how can I interpolate between values that grow exponentially?

我有一个 Pandas 系列,其中包含产品的价格演变(我的国家/地区很高 inflation),或者说,某个国家/地区的冠状病毒感染人数。这两个数据集中的值呈指数增长;这意味着如果你有类似 [3, NaN, 27] 的东西,你会想要进行插值,以便在这种情况下用 9 填充缺失值。我检查了 Pandas 文档中的插值方法,但除非我遗漏了什么,否则我没有找到任何关于这种插值的信息。

我可以手动做,你只要取几何平均值,或者在更多值的情况下,通过做(最终value/initial值)^(1 /它们之间的距离)来获得平均增长率然后相应地相乘。但是我的系列中有很多值要填写,那么我该如何自动完成呢?我想我遗漏了一些东西,因为这似乎是非常基本的东西。

谢谢。

您可以取级数的对数,进行线性插值,然后将其转换回指数尺度。

import pandas as pd
import numpy as np

arr = np.exp(np.arange(1,10))
arr = pd.Series(arr)
arr[3] = None
0       2.718282
1       7.389056
2      20.085537
3            NaN
4     148.413159
5     403.428793
6    1096.633158
7    2980.957987
8    8103.083928
dtype: float64
arr = np.log(arr) # Transform according to assumed process.
arr = arr.interpolate('linear') # Interpolate.
np.exp(arr) # Invert previous transformation.
0       2.718282
1       7.389056
2      20.085537
3      54.598150
4     148.413159
5     403.428793
6    1096.633158
7    2980.957987
8    8103.083928
dtype: float64