用于 pandas `idxmax` 方法的时间复杂度/算法

Time complexity / algorithm used for pandas `idxmax` method

您好,我正在尝试了解 pd.DataFrame.idxmax 的效率如何,看看是否值得用可能更高效的自定义算法(例如,使用二进制搜索)替换。

我想了解此方法背后的算法或至少了解其复杂性,但到目前为止我还没有成功。如有任何帮助,我们将不胜感激。

根据source, the authors state This method is the DataFrame version of ndarray.argmax. This method argmax have a time complexity of O(N) as shown 。然后可以合理地假设 pd.DataFrame.idxmax 具有相同的时间复杂度。

如果您想实现自己的搜索算法,请记住您建议的二分搜索需要一个排序的项目数组,DataFrame 列可能不是这种情况。