集成Power pdf以获得能量pdf?

Integrating Power pdf to get energy pdf?

我正在想办法解决这个看似简单的问题,但我无法说服自己找到正确的方法。

我有时间序列数据,代表功率输出 (P) 的 pdf,随时间变化,还有 cdf 和分位数函数 - f(P,t)、F(P,t) 和 q( p,t)。我需要从该数据中找到给定时间间隔 [t1,t2] 内能量的 pdf、cdf 和分位数函数 - 比如 e()、E() 和 qe()。

显然能量是 [t1,t2] 的幂的积分,但我如何最好地计算 e、E 和 qe?

我最好的猜测是,由于 q(p,t) 是幂,我应该通过在时间间隔内对 q 积分来生成 qe,然后从中计算其他分布。

就这么简单吗,还是我需要掌握随机微积分?

需要说明的其他详细信息

我们得到的数据是每个时间 t 的 'black-box' 预测 f(P)、F(P)、q(P) 的时间序列,其中 P 是瞬时功率,对于我想要获得 e(P) 的时间间隔,将有大约 100 个预测。 'Black-box' 我的意思是我可以调用一个函数来计算 P 的 f、F、q,但我不知道底层分布。

几乎可以肯定,黑盒函数正在对生成功率预测的模型的输出数据进行插值,但我们无法访问它。我猜它 不会 是任何直截了当的东西,因为它来自一连串的非线性变换。它实际上是风电场的生产预测:风速可能是正态分布的,但多种地形和涡轮机改造将改变这一点。

进一步说明 (我已经编辑了原文以删除能量分布函数中令人困惑的变量名称。)

预测结果如下:

我们需要 e、E 和 qe 的区间 [t1,t2] 被细分为 100 个(比方说)子区间 k=1...100。对于每个 k,我们都有一个不同的 f(P),称它们为 f_k(P)。我们需要从这组 f_k(P).

计算区间的能量分布

感谢您的澄清。据我所知,您没有足够的信息来正确解决这个问题。具体来说,您需要对从一个时间步到下一个时间步的功率依赖性进行一些估计。时间步长越长,依赖越少;如果步骤足够长,则从一个步骤到下一个步骤的功率可能大致独立,这将是个好消息,因为这会大大简化分析。那么,时间步长是多少?一小时?一分钟?一天?

如果时间步足够长可以独立,那么能量分布就是100个变量的分布,根据中心极限定理会非常接近正态分布。在这种情况下很容易计算出总能量的均值和方差。

否则,分配的结果会更复杂一些。我的猜测是独立步骤方法估计的方差会太大——我相信实际方差会稍微小一些。

从你所说的来看,你没有任何关于时间依赖性的信息。也许您可以从其他来源找到或推导出自相关函数的估计值——如果这个问题已经针对风力发电进行了研究,我不会感到惊讶。如果这个问题的一般版本已经被研究过,我也不会感到惊讶——也许你可以搜索类似 "distribution of a sum of autocorrelated variables." 的内容,你可能会对 stats.stackexchange.com 上的那个问题感兴趣。