如何使用回归分析来识别相关性

How to use Regression Analysis to Identify Correlation

我有两个变量 Price 和 Distance,想知道这两者之间是否存在相关性以及相关性在统计上的显着性。

我使用最小二乘法在 python 中创建了一个线性模型,但不知道如何从中导出任何相关性度量。

谢谢,

为了找到两个变量之间的相关性,最好的方法是对两个变量做散点图。散点图可以让您直观地了解变量是如何相关的。

还有另一种方法可以通过使用 seaborn 库绘制热图来检查相关性。 seaborn 热图看起来像这样,具有不同变量的相关值。

您可以从回归输出中得出相关性,前提是我们讨论的是具有一个预测变量的简单回归。有两种方法。首先,简单地取 R 平方统计量的平方根。当然,由于是R-squared,我们不确定相关性是正还是负。所以,看看 beta 系数上的符号。如果它是负的,你知道相关性也是负的。或者,您将 beta 系数除以标准差的比率。

formula

所以,

formula

然后您可以将 r 转换为 t 统计量以确定它是否显着。