从一列中获取前 2 项以创建另一列 Pandas
Get the first 2 items from a column to make another Column Pandas
我有一个带有 DateTime 列的 table,如下所示。时间间隔以小时为单位
ID TimeInterval Temperature
1 00:00:00 27
2 01:00:00 26
3 02:00:00 24
4 03:00:00 24
5 04:00:00 25
我尝试使用时间间隔进行绘图。但是,我收到一个错误
float() argument must be a string or a number, not 'datetime.time'
所以,我想提取 Column TimeInterval 的前两个数字并将其放入一个新列中。
有什么想法可以提取吗?
您可以使用 strftime
和 %H
几个小时
# Create test data
df = pd.DataFrame({'ID': [1, 2, 3, 4, 5], 'TimeInterval': ['00:00:00', '01:00:00', '02:00:00', '03:00:00', '04:00:00'], 'Temperature': [27, 26, 24, 24, 25]})
# Change the format to %H:%M:%S.
df['TimeInterval'] = pd.to_datetime(df['TimeInterval'], format='%H:%M:%S')
# Create a new column
df['new'] = df['TimeInterval'].dt.strftime('%H')
输出:
ID TimeInterval Temperature new
1 1900-01-01 00:00:00 27 00
2 1900-01-01 01:00:00 26 01
3 1900-01-01 02:00:00 24 02
4 1900-01-01 03:00:00 24 03
5 1900-01-01 04:00:00 25 04
如果“TimeInterval”列是一个字符串...
你可以 select 它的前 2 个字符,然后将它解析为一个整数:
df["new"] = df["TimeInterval"].str[:2].astype(int)
但这将是一个丑陋的解决方案。
这是一个更好的解决方案
# test data
df = pd.DataFrame([{'TimeInterval':'00:00:00'},
{'TimeInterval':'01:00:00'}])
# cast it to a datetime object
df['TimeInterval'] = pd.to_datetime(df['TimeInterval'], format='%H:%M:%S')
# select the hours
df['hours'] = df['TimeInterval'].dt.hour
我有一个带有 DateTime 列的 table,如下所示。时间间隔以小时为单位
ID TimeInterval Temperature
1 00:00:00 27
2 01:00:00 26
3 02:00:00 24
4 03:00:00 24
5 04:00:00 25
我尝试使用时间间隔进行绘图。但是,我收到一个错误
float() argument must be a string or a number, not 'datetime.time'
所以,我想提取 Column TimeInterval 的前两个数字并将其放入一个新列中。 有什么想法可以提取吗?
您可以使用 strftime
和 %H
几个小时
# Create test data
df = pd.DataFrame({'ID': [1, 2, 3, 4, 5], 'TimeInterval': ['00:00:00', '01:00:00', '02:00:00', '03:00:00', '04:00:00'], 'Temperature': [27, 26, 24, 24, 25]})
# Change the format to %H:%M:%S.
df['TimeInterval'] = pd.to_datetime(df['TimeInterval'], format='%H:%M:%S')
# Create a new column
df['new'] = df['TimeInterval'].dt.strftime('%H')
输出:
ID TimeInterval Temperature new
1 1900-01-01 00:00:00 27 00
2 1900-01-01 01:00:00 26 01
3 1900-01-01 02:00:00 24 02
4 1900-01-01 03:00:00 24 03
5 1900-01-01 04:00:00 25 04
如果“TimeInterval”列是一个字符串... 你可以 select 它的前 2 个字符,然后将它解析为一个整数:
df["new"] = df["TimeInterval"].str[:2].astype(int)
但这将是一个丑陋的解决方案。
这是一个更好的解决方案
# test data
df = pd.DataFrame([{'TimeInterval':'00:00:00'},
{'TimeInterval':'01:00:00'}])
# cast it to a datetime object
df['TimeInterval'] = pd.to_datetime(df['TimeInterval'], format='%H:%M:%S')
# select the hours
df['hours'] = df['TimeInterval'].dt.hour