从一列中获取前 2 项以创建另一列 Pandas

Get the first 2 items from a column to make another Column Pandas

我有一个带有 DateTime 列的 table,如下所示。时间间隔以小时为单位

ID  TimeInterval   Temperature
1   00:00:00            27
2   01:00:00            26
3   02:00:00            24
4   03:00:00            24
5   04:00:00            25

我尝试使用时间间隔进行绘图。但是,我收到一个错误 float() argument must be a string or a number, not 'datetime.time'

所以,我想提取 Column TimeInterval 的前两个数字并将其放入一个新列中。 有什么想法可以提取吗?

您可以使用 strftime%H 几个小时

# Create test data
df = pd.DataFrame({'ID': [1, 2, 3, 4, 5], 'TimeInterval': ['00:00:00', '01:00:00', '02:00:00', '03:00:00', '04:00:00'], 'Temperature': [27, 26, 24, 24, 25]})

# Change the format to %H:%M:%S.
df['TimeInterval'] = pd.to_datetime(df['TimeInterval'], format='%H:%M:%S')

# Create a new column
df['new'] = df['TimeInterval'].dt.strftime('%H')

输出:

ID  TimeInterval            Temperature new
1   1900-01-01 00:00:00     27          00
2   1900-01-01 01:00:00     26          01
3   1900-01-01 02:00:00     24          02
4   1900-01-01 03:00:00     24          03
5   1900-01-01 04:00:00     25          04

如果“TimeInterval”列是一个字符串... 你可以 select 它的前 2 个字符,然后将它解析为一个整数:

df["new"] = df["TimeInterval"].str[:2].astype(int)

但这将是一个丑陋的解决方案。

这是一个更好的解决方案

# test data
df = pd.DataFrame([{'TimeInterval':'00:00:00'}, 
                   {'TimeInterval':'01:00:00'}])

# cast it to a datetime object
df['TimeInterval'] = pd.to_datetime(df['TimeInterval'], format='%H:%M:%S')

# select the hours
df['hours'] = df['TimeInterval'].dt.hour