量化时间线数据以进行平均和直方图

Quantizing timeline data for averaging and histograms

我有一些原始电子表格数据,其格式如下:

12/7/2016 3:07:00, 88.05,
12/7/2016 3:08:00, 89.10,
12/7/2016 3:13:00, 87.00,
etc

这些数据点不是定期采样的,而是全天随机收集的。

使用 Google 表格,我可以轻松地将其绘制到时间轴图表上。这会将值放在时间轴上的正确位置,并将不均匀的采样间隔考虑在内。

我想生成时间线数据的直方图,同时考虑时间戳并计算时间范围内的平均值。我相信如果我简单地 运行 通过内置直方图或 select 我的数据值并通过平均函数 运行 它,它会因不均匀的采样间隔而倾斜。

量化采样间隔(最好在 Google 张内)以生成直方图和求平均值的最简单方法是什么?

是否有一种内置方法可以在考虑时间戳数据的同时生成 histograms/averaging 个值,从而无需量化数据?

您可以按如下方式计算出合适的平均值(假设您的数据在 A2:B50 范围内)

=sum(arrayformula((A3:A50-A2:A49)*(B3:B50+B2:B49)/2))/(A50-A2)

这个公式实现了Trapezoidal rule:分配给每个时间间隔的值是该间隔结束时观测值的平均值。

没有内置的 "weighted histogram" 工具,因此似乎需要重新采样才能创建具有代表性的直方图。这是一种重新采样的方法。假设您想要 20 个样本;然后在C2输入

=arrayformula(A2+(row(1:20)-1)*(A50-A2)/19)

得到20个均匀分布的时间值。 (因为fence-post的区别所以除以19。)然后在D2中,

=arrayformula(vlookup(C2:C21, A2:B50, 2))

将为每个采样时间查找一个值。然后您可以从 D 列构建直方图。