来自两个输入数据集的多输出回归
Multi-output regression from two input datasets
是否可以从两个数据集 X1
和 X2
回归一个数据集 Y
,如果全部
X1
、X2
和 Y
是矩阵。所以,这是一个多输出回归问题。
x1_train, x1_test, x2_train, x2_test, y_train, y_test = train_test_split(x1, x2, y, test_size=0.2)
Lasso_Regr = Lasso(alpha=0.05, normalize=True)
Lasso_Regr.fit([x1_train, x2_train], y_train)
y_pred = Lasso_Regr.predict([x1_test, x2_test])
我收到以下错误:
Found array with dim 3. Estimator expected <= 2.*
如果您分别拆分训练集的预测变量,这是一种误导,因为两个预测变量之间的映射对于准确预测是必要的。
既然导入了csv,先转换成垂直格式,转换成data frame再做如下分析。
已编辑:
示例代码:
import pandas as pd
import csv
from itertools import izip
from sklearn import linear_model, model_selection
a = izip(*csv.reader(open("input.csv", "rb")))
csv.writer(open("output.csv", "wb")).writerows(a)
df = pd.read_csv("output.csv")
print(df)
x = df[['x1', 'x2', 'x3']]
y = df['y']
x_train, x_test, y_train, y_test = model_selection.train_test_split(x, y, test_size=0.2)
Lasso_Regr = linear_model.Lasso(alpha=0.05, normalize=True)
Lasso_Regr.fit(x_train, y_train)
y_pred = Lasso_Regr.predict(x_test)
print y_pred
您可以添加任意数量的预测变量。
是否可以从两个数据集 X1
和 X2
回归一个数据集 Y
,如果全部
X1
、X2
和 Y
是矩阵。所以,这是一个多输出回归问题。
x1_train, x1_test, x2_train, x2_test, y_train, y_test = train_test_split(x1, x2, y, test_size=0.2)
Lasso_Regr = Lasso(alpha=0.05, normalize=True)
Lasso_Regr.fit([x1_train, x2_train], y_train)
y_pred = Lasso_Regr.predict([x1_test, x2_test])
我收到以下错误:
Found array with dim 3. Estimator expected <= 2.*
如果您分别拆分训练集的预测变量,这是一种误导,因为两个预测变量之间的映射对于准确预测是必要的。
既然导入了csv,先转换成垂直格式,转换成data frame再做如下分析。
已编辑: 示例代码:
import pandas as pd
import csv
from itertools import izip
from sklearn import linear_model, model_selection
a = izip(*csv.reader(open("input.csv", "rb")))
csv.writer(open("output.csv", "wb")).writerows(a)
df = pd.read_csv("output.csv")
print(df)
x = df[['x1', 'x2', 'x3']]
y = df['y']
x_train, x_test, y_train, y_test = model_selection.train_test_split(x, y, test_size=0.2)
Lasso_Regr = linear_model.Lasso(alpha=0.05, normalize=True)
Lasso_Regr.fit(x_train, y_train)
y_pred = Lasso_Regr.predict(x_test)
print y_pred
您可以添加任意数量的预测变量。