使用 Dask DataFrame 计算前向差异?
Compute forward difference with Dask DataFrame?
如何使用 Dask DataFrame 计算第一个离散差异?或者,在 "Pandas speak" 中,如何在 Dask 中执行 pandas.DataFrame.diff()
?从数学上讲,操作非常简单:从移动了一行或多行的自身副本中减去一个列向量。
我尝试通过以下方式在 Dask 中实现 diff()
,其中 none 有效(但):
df - df.shift(periods=1)
适用于 Pandas。但是 Dask DataFrame 没有 shift()
方法。
df.values[:-1] - df.values[1:]
在 Pandas 中工作。但是我看不到如何通过 position. 索引到 Dask DataFrame
我目前实现 diff
的最佳想法是将一些自定义代码包装在 dask.dataframe.rolling.wrap_rolling
中,如 中所建议的那样(尽管我无法找到任何文档如何操作)。或者使用 Dask Delayed 包装一些自定义代码?还有其他想法吗?
diff
方法现已添加到 DataFrame 和 Series,在此 PR 中:https://github.com/dask/dask/pull/1769。与 pandas.
中的工作方式相同
如何使用 Dask DataFrame 计算第一个离散差异?或者,在 "Pandas speak" 中,如何在 Dask 中执行 pandas.DataFrame.diff()
?从数学上讲,操作非常简单:从移动了一行或多行的自身副本中减去一个列向量。
我尝试通过以下方式在 Dask 中实现 diff()
,其中 none 有效(但):
df - df.shift(periods=1)
适用于 Pandas。但是 Dask DataFrame 没有shift()
方法。df.values[:-1] - df.values[1:]
在 Pandas 中工作。但是我看不到如何通过 position. 索引到 Dask DataFrame
我目前实现 diff
的最佳想法是将一些自定义代码包装在 dask.dataframe.rolling.wrap_rolling
中,如
diff
方法现已添加到 DataFrame 和 Series,在此 PR 中:https://github.com/dask/dask/pull/1769。与 pandas.