不规则时间间隔的平均值
Averaging values with irregular time intervals
我有几对测量数组和我想要平均的测量时间。不幸的是,每对进行这些测量的时间不规则或相同。
我对它们进行平均的想法是创建一个新数组,其中包含每秒的值,然后对它们进行平均。它有效,但看起来有点笨拙,这意味着我必须创建许多不必要的长数组。
示例输入
m1 = [0.4, 0.6, 0.2]
t1 = [0.0, 2.4, 5.2]
m2 = [1.0, 1.4, 1.0]
t2 = [0.0, 3.6, 4.8]
每秒为值生成常规数组
r1 = [0.4, 0.4, 0.4, 0.6, 0.6, 0.6, 0.2]
r2 = [1.0, 1.0, 1.0, 1.0, 1.4, 1.0]
最短数组长度的平均值
a = [0.7, 0.7, 0.7, 0.8, 1.0, 0.8]
我尝试给定测量数组列表 measurements
和相应的时间间隔数组列表 times
def granulate(values, times):
count = 0
regular_values = []
for index, x in enumerate(times):
while count <= x:
regular_values.append(values[index])
count += 1
return np.array(regular_values)
processed_measurements = [granulate(m, t) for m, t in zip(measurements, times)]
min_length = min(len(m) for m in processed_measurements )
processed_measurements = [m[:min_length] for m in processed_measurements]
average_measurement = np.mean(processed_measurements, axis=0)
有没有更好的方法,最好是使用 numpy 函数?
这将取最近秒的平均值:
time_series = np.arange(np.stack((t1, t2)).max())
np.mean([m1[abs(t1-time_series[:,None]).argmin(axis=1)], m2[abs(t2-time_series[:,None]).argmin(axis=1)]], axis=0)
如果你想将时间设置为每秒(有可能推广到更多数组):
m = [m1, m2]
t = [t1, t2]
m_t=[]
time_series = np.arange(np.stack(t).max())
for i in range(len(t)):
time_diff = time_series-t[i][:,None]
m_t.append(m[i][np.where(time_diff > 0, time_diff, np.inf).argmin(axis=0)])
average = np.mean(m_t, axis=0)
输出:
[0.7 0.7 0.7 0.8 1. 0.8]
我看到两个可能的解决方案:
- 为每个时间步创建一个 'bucket',比方说 1 秒,然后将在时间步长 +/- 1 秒内进行的所有测量插入存储桶中。平均存储桶中的所有值。
- 对每个测量行进行插值,使它们具有相等的时间步长。平均每个时间步长的所有测量值
你可以这样做(有点麻木的解决方案):
import numpy as np
# oddly enough - numpy doesn't have it's own ffill function:
def np_ffill(arr):
mask = np.arange(len(arr))
mask[np.isnan(arr)]=0
np.maximum.accumulate(mask, axis=0, out=mask)
return arr[mask]
t1=np.ceil(t1).astype("int")
t2=np.ceil(t2).astype("int")
r1=np.empty(max(t1)+1)
r2=np.empty(max(t2)+1)
r1[:]=np.nan
r2[:]=np.nan
r1[t1]=m1
r2[t2]=m2
r1=np_ffill(r1)
r2=np_ffill(r2)
>>> print(r1,r2)
[0.4 0.4 0.4 0.6 0.6 0.6 0.2] [1. 1. 1. 1. 1.4 1. ]
#in order to get avg:
r3=np.vstack([r1[:len(r2)],r2[:len(r1)]]).mean(axis=0)
>>> print(r3)
[0.7 0.7 0.7 0.8 1. 0.8]
我有几对测量数组和我想要平均的测量时间。不幸的是,每对进行这些测量的时间不规则或相同。
我对它们进行平均的想法是创建一个新数组,其中包含每秒的值,然后对它们进行平均。它有效,但看起来有点笨拙,这意味着我必须创建许多不必要的长数组。
示例输入
m1 = [0.4, 0.6, 0.2]
t1 = [0.0, 2.4, 5.2]
m2 = [1.0, 1.4, 1.0]
t2 = [0.0, 3.6, 4.8]
每秒为值生成常规数组
r1 = [0.4, 0.4, 0.4, 0.6, 0.6, 0.6, 0.2]
r2 = [1.0, 1.0, 1.0, 1.0, 1.4, 1.0]
最短数组长度的平均值
a = [0.7, 0.7, 0.7, 0.8, 1.0, 0.8]
我尝试给定测量数组列表 measurements
和相应的时间间隔数组列表 times
def granulate(values, times):
count = 0
regular_values = []
for index, x in enumerate(times):
while count <= x:
regular_values.append(values[index])
count += 1
return np.array(regular_values)
processed_measurements = [granulate(m, t) for m, t in zip(measurements, times)]
min_length = min(len(m) for m in processed_measurements )
processed_measurements = [m[:min_length] for m in processed_measurements]
average_measurement = np.mean(processed_measurements, axis=0)
有没有更好的方法,最好是使用 numpy 函数?
这将取最近秒的平均值:
time_series = np.arange(np.stack((t1, t2)).max())
np.mean([m1[abs(t1-time_series[:,None]).argmin(axis=1)], m2[abs(t2-time_series[:,None]).argmin(axis=1)]], axis=0)
如果你想将时间设置为每秒(有可能推广到更多数组):
m = [m1, m2]
t = [t1, t2]
m_t=[]
time_series = np.arange(np.stack(t).max())
for i in range(len(t)):
time_diff = time_series-t[i][:,None]
m_t.append(m[i][np.where(time_diff > 0, time_diff, np.inf).argmin(axis=0)])
average = np.mean(m_t, axis=0)
输出:
[0.7 0.7 0.7 0.8 1. 0.8]
我看到两个可能的解决方案:
- 为每个时间步创建一个 'bucket',比方说 1 秒,然后将在时间步长 +/- 1 秒内进行的所有测量插入存储桶中。平均存储桶中的所有值。
- 对每个测量行进行插值,使它们具有相等的时间步长。平均每个时间步长的所有测量值
你可以这样做(有点麻木的解决方案):
import numpy as np
# oddly enough - numpy doesn't have it's own ffill function:
def np_ffill(arr):
mask = np.arange(len(arr))
mask[np.isnan(arr)]=0
np.maximum.accumulate(mask, axis=0, out=mask)
return arr[mask]
t1=np.ceil(t1).astype("int")
t2=np.ceil(t2).astype("int")
r1=np.empty(max(t1)+1)
r2=np.empty(max(t2)+1)
r1[:]=np.nan
r2[:]=np.nan
r1[t1]=m1
r2[t2]=m2
r1=np_ffill(r1)
r2=np_ffill(r2)
>>> print(r1,r2)
[0.4 0.4 0.4 0.6 0.6 0.6 0.2] [1. 1. 1. 1. 1.4 1. ]
#in order to get avg:
r3=np.vstack([r1[:len(r2)],r2[:len(r1)]]).mean(axis=0)
>>> print(r3)
[0.7 0.7 0.7 0.8 1. 0.8]