多项式回归没有使用我的数据,因为它认为日期是字符串
Polynomial regression isn't taking my data because it's considering date to be strings
我为一个学校项目制作了这个程序,它运行良好,但我的数据应该是日期格式
但每次我将日期作为变量插入时,它都会提示我一个错误提示 ( can't float string "2022-05-16" )
提前致谢
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import datetime
dataset = pd.read_csv('/content/Position_Salaries.csv')
X = dataset.iloc[:, 1:2].values
y = dataset.iloc[:, 2].values
dataset
"""from sklearn.cross_validation import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 0)"""
"""from sklearn.preprocessing import StandardScaler
sc_X = StandardScaler()
X_train = sc_X.fit_transform(X_train)
X_test = sc_X.transform(X_test)"""
from sklearn.linear_model import LinearRegression
lin_reg = LinearRegression()
lin_reg.fit(X, y)
要将日期时间列作为 datetime-dtype 而不是字符串,您可以在 pandas.read_csv:
中使用 parse_dates
参数
dataset = pd.read_csv('/content/Position_Salaries.csv', parse_dates=...)
或者您可以稍后使用 pandas.to_datetime:
将日期时间列转换为日期时间数据类型
dataset[date_col] = pd.to_datetime(dataset[date_col])
之后,您可能希望使用 .dt accessor methods.
提取日期组件
我为一个学校项目制作了这个程序,它运行良好,但我的数据应该是日期格式 但每次我将日期作为变量插入时,它都会提示我一个错误提示 ( can't float string "2022-05-16" )
提前致谢
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import datetime
dataset = pd.read_csv('/content/Position_Salaries.csv')
X = dataset.iloc[:, 1:2].values
y = dataset.iloc[:, 2].values
dataset
"""from sklearn.cross_validation import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 0)"""
"""from sklearn.preprocessing import StandardScaler
sc_X = StandardScaler()
X_train = sc_X.fit_transform(X_train)
X_test = sc_X.transform(X_test)"""
from sklearn.linear_model import LinearRegression
lin_reg = LinearRegression()
lin_reg.fit(X, y)
要将日期时间列作为 datetime-dtype 而不是字符串,您可以在 pandas.read_csv:
中使用parse_dates
参数
dataset = pd.read_csv('/content/Position_Salaries.csv', parse_dates=...)
或者您可以稍后使用 pandas.to_datetime:
将日期时间列转换为日期时间数据类型dataset[date_col] = pd.to_datetime(dataset[date_col])
之后,您可能希望使用 .dt accessor methods.
提取日期组件