尝试使用 pandas 进行多元回归时发现 ValueError
ValueError found while trying to use pandas for multiple regression
我正在尝试 运行 使用 panda 和大型数据集的简单多元线性回归程序,但我收到一条错误消息:
ValueError: The truth value of a DataFrame is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
密码是:
from sklearn import linear_model
import pandas as pd
data = pd.read_csv('manydatas.csv')
x = data[['Bedrooms', 'City', 'Age']]
y = data['Selling Price']
line = linear_model.LinearRegression(x,y)
line.fit(x,y)
如有任何帮助,我将不胜感激,谢谢
编辑:这是包含我的数据的 .csv 文件的 link 驱动器,有超过一千个元素,所以我只是 link 整个事情:https://drive.google.com/file/d/1VCNJZNKYRmUd7A6qQlDnzTbiO_7x7I3s/view?usp=sharing
不要在模型构造函数中使用您的数据
line = linear_model.LinearRegression().fit(x,y)
要进行线性回归,您必须使用 linear_model.LinearRegression().fit(X, y)
,而不是 linear_model.LinearRegression(x,y)
。如果问题仍然存在,请尝试将数据转换为 numpy 数组。 (来源:https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html)
我正在尝试 运行 使用 panda 和大型数据集的简单多元线性回归程序,但我收到一条错误消息:
ValueError: The truth value of a DataFrame is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
密码是:
from sklearn import linear_model
import pandas as pd
data = pd.read_csv('manydatas.csv')
x = data[['Bedrooms', 'City', 'Age']]
y = data['Selling Price']
line = linear_model.LinearRegression(x,y)
line.fit(x,y)
如有任何帮助,我将不胜感激,谢谢
编辑:这是包含我的数据的 .csv 文件的 link 驱动器,有超过一千个元素,所以我只是 link 整个事情:https://drive.google.com/file/d/1VCNJZNKYRmUd7A6qQlDnzTbiO_7x7I3s/view?usp=sharing
不要在模型构造函数中使用您的数据
line = linear_model.LinearRegression().fit(x,y)
要进行线性回归,您必须使用 linear_model.LinearRegression().fit(X, y)
,而不是 linear_model.LinearRegression(x,y)
。如果问题仍然存在,请尝试将数据转换为 numpy 数组。 (来源:https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html)