如何从不同的 csv 执行线性回归?

How to perform linear regression from different csv?

我想使用来自不同数据帧的两个变量执行多元线性回归。

Y1 = pd.read_csv (r'C:\Y.csv') 
Y1 = pd.DataFrame(Y,columns=['Year','JJASON','JJA','JAS','ASO','SON'])
Y1=  Y[Y['Year'].between(1984,2020, inclusive="both")]

X1 = pd.read_csv (r'C:\X1.csv') 
X1 = pd.DataFrame(X1,columns=['Year','Jan','Feb','Mar','Apr','May','Jun','Jul','Aug','Sep','Oct','Nov','Dec'])
X1=  X1[X2['Year'].between(1984,2020, inclusive="both")]

X2 = pd.read_csv (r'C:\X2.csv',na_values= 'NaN') 
X2 = pd.DataFrame(Chukchi,columns=['Year','Jan','Feb','Mar','Apr','May','Jun','Jul','Aug','Sep','Oct','Nov','Dec'])
X2=X2[X2['Year'].between(1984,2020, inclusive="both")]

到目前为止,我能够读取 .csv 文件并使用一个变量 X1 执行回归。

regr = linear_model.LinearRegression()
regr.fit(X1(-1,1), Y1)

但是,我在网上找到的关于多元线性回归的大多数示例都使用了一个 csv 中的两个 X。因此他们使用:

df [[X1,X2]]

我真的是 python 编程新手。如何使用来自不同 .csv 的 2 个不同 X 执行多元线性回归?谢谢。

我想在 3 月份对 X1 和 X2 以及 Y1 中的 JJASON 执行多元线性回归。 Attached is the link to Y, X1, and X2 data

如果只是在Y中回归JJASON,在X1和X2中回归March,你可以这样做:

from sklearn.linear_model import LinearRegression
import numpy as np

LR = LinearRegression()
Y = Y[['JJASON']]
X = np.hstack(X1[['March']],X2[['March']])
LR.fit(Y,X)