如何使用回归分析来识别相关性
How to use Regression Analysis to Identify Correlation
我有两个变量 Price 和 Distance,想知道这两者之间是否存在相关性以及相关性在统计上的显着性。
我使用最小二乘法在 python 中创建了一个线性模型,但不知道如何从中导出任何相关性度量。
谢谢,
为了找到两个变量之间的相关性,最好的方法是对两个变量做散点图。散点图可以让您直观地了解变量是如何相关的。
还有另一种方法可以通过使用 seaborn 库绘制热图来检查相关性。 seaborn 热图看起来像这样,具有不同变量的相关值。
您可以从回归输出中得出相关性,前提是我们讨论的是具有一个预测变量的简单回归。有两种方法。首先,简单地取 R 平方统计量的平方根。当然,由于是R-squared,我们不确定相关性是正还是负。所以,看看 beta 系数上的符号。如果它是负的,你知道相关性也是负的。或者,您将 beta 系数除以标准差的比率。
%7D%7Bvar(X_i)%7D%20%3D%20corr(Y%2CX_i)%20*%20%5Cfrac%7Bsd(Y)%7D%7Bsd(X_i)%7D%5C%5D%0A)
所以,
%20%3D%20%5Cfrac%20%7B%5Cbeta_i%7D%7B%5Cfrac%20%7Bsd(Y)%7D%7Bsd(X_i)%7D%7D%5C%5D%0A)
然后您可以将 r 转换为 t 统计量以确定它是否显着。
我有两个变量 Price 和 Distance,想知道这两者之间是否存在相关性以及相关性在统计上的显着性。
我使用最小二乘法在 python 中创建了一个线性模型,但不知道如何从中导出任何相关性度量。
谢谢,
为了找到两个变量之间的相关性,最好的方法是对两个变量做散点图。散点图可以让您直观地了解变量是如何相关的。
还有另一种方法可以通过使用 seaborn 库绘制热图来检查相关性。 seaborn 热图看起来像这样,具有不同变量的相关值。
您可以从回归输出中得出相关性,前提是我们讨论的是具有一个预测变量的简单回归。有两种方法。首先,简单地取 R 平方统计量的平方根。当然,由于是R-squared,我们不确定相关性是正还是负。所以,看看 beta 系数上的符号。如果它是负的,你知道相关性也是负的。或者,您将 beta 系数除以标准差的比率。
所以,
然后您可以将 r 转换为 t 统计量以确定它是否显着。