在 python 中计算相关矩阵的最有效方法

Most efficient way to calculate correlation matrix in python

我需要计算 5000 种产品的销售相关性,这将产生 5000 x 5000 的相关矩阵。我正在尝试使用 df.corr() 在 pandas 中完成此操作,但它会导致内存问题。有没有更有效的方法来实现这一目标?

使用 np.corrcoef...我可以使用它在一分钟内处理矩阵。