多项式回归没有使用我的数据,因为它认为日期是字符串

Polynomial regression isn't taking my data because it's considering date to be strings

我为一个学校项目制作了这个程序,它运行良好,但我的数据应该是日期格式 但每次我将日期作为变量插入时,它都会提示我一个错误提示 ( can't float string "2022-05-16" )

提前致谢

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import datetime 

dataset = pd.read_csv('/content/Position_Salaries.csv')
X = dataset.iloc[:, 1:2].values
y = dataset.iloc[:, 2].values

dataset

"""from sklearn.cross_validation import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 0)"""

"""from sklearn.preprocessing import StandardScaler
sc_X = StandardScaler()
X_train = sc_X.fit_transform(X_train)
X_test = sc_X.transform(X_test)"""

from sklearn.linear_model import LinearRegression
lin_reg = LinearRegression()
lin_reg.fit(X, y)

要将日期时间列作为 datetime-dtype 而不是字符串,您可以在 pandas.read_csv:

中使用 parse_dates 参数
dataset = pd.read_csv('/content/Position_Salaries.csv', parse_dates=...)

或者您可以稍后使用 pandas.to_datetime:

将日期时间列转换为日期时间数据类型
dataset[date_col] = pd.to_datetime(dataset[date_col])

之后,您可能希望使用 .dt accessor methods.

提取日期组件