列名无法识别?如何设置列名?
Column names are not recognized? How to set the column names?
我有一个无法为其调用列的数据集。在下面的屏幕截图中,我用黄色标记了我需要识别为列(Vale On、Petroleo 等)和日期列,因为我正在处理时间序列数据,所以我需要将其识别为日期。
我尝试过重置索引和一些相关的解决方案,但没有任何效果。我是Python的新手,所以如果太明显了,我很抱歉。
# use first row as column names
df.columns = df.iloc[0]
# and then drop it
df = df.iloc[1:]
# convert first col to date
# if it doesnt work, try passing format=... refer https://strftime.org/
# also https://pandas.pydata.org/docs/reference/api/pandas.to_datetime.html
df['Date'] = pd.to_datetime(df['Date'])
如果解析日期一直失败,调试提示是检查您的日期字符串是否一致,可能像这样:df['Date'].str.len().value_counts()
。希望 return 只有一个长度。如果 return 有多行,则意味着您有不一致和异常的数据,您必须清理这些数据。
我有一个无法为其调用列的数据集。在下面的屏幕截图中,我用黄色标记了我需要识别为列(Vale On、Petroleo 等)和日期列,因为我正在处理时间序列数据,所以我需要将其识别为日期。
我尝试过重置索引和一些相关的解决方案,但没有任何效果。我是Python的新手,所以如果太明显了,我很抱歉。
# use first row as column names
df.columns = df.iloc[0]
# and then drop it
df = df.iloc[1:]
# convert first col to date
# if it doesnt work, try passing format=... refer https://strftime.org/
# also https://pandas.pydata.org/docs/reference/api/pandas.to_datetime.html
df['Date'] = pd.to_datetime(df['Date'])
如果解析日期一直失败,调试提示是检查您的日期字符串是否一致,可能像这样:df['Date'].str.len().value_counts()
。希望 return 只有一个长度。如果 return 有多行,则意味着您有不一致和异常的数据,您必须清理这些数据。