如何从不同的 csv 执行线性回归?
How to perform linear regression from different csv?
我想使用来自不同数据帧的两个变量执行多元线性回归。
Y1 = pd.read_csv (r'C:\Y.csv')
Y1 = pd.DataFrame(Y,columns=['Year','JJASON','JJA','JAS','ASO','SON'])
Y1= Y[Y['Year'].between(1984,2020, inclusive="both")]
X1 = pd.read_csv (r'C:\X1.csv')
X1 = pd.DataFrame(X1,columns=['Year','Jan','Feb','Mar','Apr','May','Jun','Jul','Aug','Sep','Oct','Nov','Dec'])
X1= X1[X2['Year'].between(1984,2020, inclusive="both")]
X2 = pd.read_csv (r'C:\X2.csv',na_values= 'NaN')
X2 = pd.DataFrame(Chukchi,columns=['Year','Jan','Feb','Mar','Apr','May','Jun','Jul','Aug','Sep','Oct','Nov','Dec'])
X2=X2[X2['Year'].between(1984,2020, inclusive="both")]
到目前为止,我能够读取 .csv 文件并使用一个变量 X1 执行回归。
regr = linear_model.LinearRegression()
regr.fit(X1(-1,1), Y1)
但是,我在网上找到的关于多元线性回归的大多数示例都使用了一个 csv 中的两个 X。因此他们使用:
df [[X1,X2]]
我真的是 python 编程新手。如何使用来自不同 .csv 的 2 个不同 X 执行多元线性回归?谢谢。
我想在 3 月份对 X1 和 X2 以及 Y1 中的 JJASON 执行多元线性回归。
Attached is the link to Y, X1, and X2 data
如果只是在Y中回归JJASON
,在X1和X2中回归March
,你可以这样做:
from sklearn.linear_model import LinearRegression
import numpy as np
LR = LinearRegression()
Y = Y[['JJASON']]
X = np.hstack(X1[['March']],X2[['March']])
LR.fit(Y,X)
我想使用来自不同数据帧的两个变量执行多元线性回归。
Y1 = pd.read_csv (r'C:\Y.csv')
Y1 = pd.DataFrame(Y,columns=['Year','JJASON','JJA','JAS','ASO','SON'])
Y1= Y[Y['Year'].between(1984,2020, inclusive="both")]
X1 = pd.read_csv (r'C:\X1.csv')
X1 = pd.DataFrame(X1,columns=['Year','Jan','Feb','Mar','Apr','May','Jun','Jul','Aug','Sep','Oct','Nov','Dec'])
X1= X1[X2['Year'].between(1984,2020, inclusive="both")]
X2 = pd.read_csv (r'C:\X2.csv',na_values= 'NaN')
X2 = pd.DataFrame(Chukchi,columns=['Year','Jan','Feb','Mar','Apr','May','Jun','Jul','Aug','Sep','Oct','Nov','Dec'])
X2=X2[X2['Year'].between(1984,2020, inclusive="both")]
到目前为止,我能够读取 .csv 文件并使用一个变量 X1 执行回归。
regr = linear_model.LinearRegression()
regr.fit(X1(-1,1), Y1)
但是,我在网上找到的关于多元线性回归的大多数示例都使用了一个 csv 中的两个 X。因此他们使用:
df [[X1,X2]]
我真的是 python 编程新手。如何使用来自不同 .csv 的 2 个不同 X 执行多元线性回归?谢谢。
我想在 3 月份对 X1 和 X2 以及 Y1 中的 JJASON 执行多元线性回归。 Attached is the link to Y, X1, and X2 data
如果只是在Y中回归JJASON
,在X1和X2中回归March
,你可以这样做:
from sklearn.linear_model import LinearRegression
import numpy as np
LR = LinearRegression()
Y = Y[['JJASON']]
X = np.hstack(X1[['March']],X2[['March']])
LR.fit(Y,X)