为 `cudf` 做 `diff` 的最有效方法是什么
what is the most efficient way to do `diff` for a `cudf`
rapids.ai
cudf
类型与 pandas
有点兼容,但这里有一个奇怪的不兼容。 cudf.Series
有一个 .diff()
方法,但是 cudf.DataFrame
似乎没有。这非常烦人(例如,考虑一个股票价格数据框,其中列对应于工具)。有,当然,kludgy ays 来解决这个问题(转换为 pandas 数据框并返回到脑海中),但我想知道规范的方法是什么。有什么建议吗?
cuDF Python 涵盖了 pandas API 的大部分内容,但存在一些空白(因为您已经 运行 进入此处)。
今天,在每一列上 运行 diff
和 return 数据框的最简单方法如下:
cudf.DataFrame({col: df[col].diff() for col in df.columns})
rapids.ai
cudf
类型与 pandas
有点兼容,但这里有一个奇怪的不兼容。 cudf.Series
有一个 .diff()
方法,但是 cudf.DataFrame
似乎没有。这非常烦人(例如,考虑一个股票价格数据框,其中列对应于工具)。有,当然,kludgy ays 来解决这个问题(转换为 pandas 数据框并返回到脑海中),但我想知道规范的方法是什么。有什么建议吗?
cuDF Python 涵盖了 pandas API 的大部分内容,但存在一些空白(因为您已经 运行 进入此处)。
今天,在每一列上 运行 diff
和 return 数据框的最简单方法如下:
cudf.DataFrame({col: df[col].diff() for col in df.columns})