使用 Dask DataFrame 计算前向差异?

Compute forward difference with Dask DataFrame?

如何使用 Dask DataFrame 计算第一个离散差异?或者,在 "Pandas speak" 中,如何在 Dask 中执行 pandas.DataFrame.diff()?从数学上讲,操作非常简单:从移动了一行或多行的自身副本中减去一个列向量。

我尝试通过以下方式在 Dask 中实现 diff(),其中 none 有效(但):

我目前实现 diff 的最佳想法是将一些自定义代码包装在 dask.dataframe.rolling.wrap_rolling 中,如 中所建议的那样(尽管我无法找到任何文档如何操作)。或者使用 Dask Delayed 包装一些自定义代码?还有其他想法吗?

diff 方法现已添加到 DataFrame 和 Series,在此 PR 中:https://github.com/dask/dask/pull/1769。与 pandas.

中的工作方式相同