Python: 为什么我的线性回归图给我很多乱七八糟的彩色线条?

Python: Why does my linear regression plot give me many messy coloured lines?

这是我得到的代码,但我不确定为什么它会给我这么糟糕的情节。我哪里做错了?

import pandas as pd

df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header = None, sep = '\s+')
df.columns = ["CRIM", "ZN", 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT','MEDV']
# print df
X = df.iloc[:,:-2].values
y = df.iloc[:,-1].values

from sklearn.linear_model import LinearRegression
lr = LinearRegression()
lr.fit(X, y)

import matplotlib.pyplot as plt
plt.plot(X, lr.predict(X))
plt.show()

我怀疑你的problem/confusion这里是问题的维度。我的理解是,您希望看到一条线穿过像 here 这样的点,其中线函数接受 X 并输出 lr.predict(X)。您不会看到这一行,因为您的 X 变量有 12 列,因此您有 12 个不同的独立变量

如果您尝试绘制所有这些以及您的一个因变量 lr.predict(X),那么您将需要 13 个维度。 plot 方法不会为您绘制它。相反,它尝试为 X 中的每个维度绘制 12 条不同的线。这就是您所看到的。