如何将日期时间列四舍五入到最近的刻钟
How do I round datetime column to nearest quarter hour
我已将数据文件加载到 Python pandas 数据帧中。我有一个 2015-07-18 13:53:33.280
格式的日期时间列。
我需要做的是创建一个新列,将其四舍五入到最接近的刻钟。因此,上述日期将四舍五入为 2015-07-18 13:45:00.000
.
如何在 pandas 中执行此操作?我尝试使用 here 中的解决方案,但出现 'Series' object has no attribute 'year'
错误。
假设您的系列由 datetime
个对象组成,您需要使用 Series.apply
。示例 -
import datetime
df['<column>'] = df['<column>'].apply(lambda dt: datetime.datetime(dt.year, dt.month, dt.day, dt.hour,15*(dt.minute // 15)))
上面的例子总是四舍五入到前一刻钟(行为类似于 floor 函数)。
编辑
四舍五入到正确的刻钟(如 ,如果它是上一季度的 7 分 30 秒,则显示下一季度)。我们可以使用下面的例子 -
import datetime
df['<column>'] = df['<column>'].apply(lambda dt: datetime.datetime(dt.year, dt.month, dt.day, dt.hour,15*round((float(dt.minute) + float(dt.second)/60) / 15)))
以上只会考虑最近的秒数,如果你想考虑 millisecond/microsecond,你可以将其添加到上面的等式中 - (float(dt.minute) + float(dt.second)/60 + float(dt.microsecond)/60000000)
Anand S Kumar 的回答没有四舍五入到最接近的刻钟,而是将分钟截断到最接近的 15 分钟以下。
实际上,在您的示例中,2015-07-18 13:53:33.280
应该四舍五入为 2015-07-18 14:00:00.000
,因为 53:33.280
比 45 分钟更接近 60 分钟。
我在 this post 中找到了更可靠的舍入答案。
对于您的情况,这应该可行:
import datetime
def round_time(time, round_to):
"""roundTo is the number of minutes to round to"""
rounded = time + datetime.timedelta(minutes=round_to/2.)
rounded -= datetime.timedelta(minutes=rounded.minute % round_to,
seconds=rounded.second,
microseconds=rounded.microsecond)
return rounded
dt['dtcolumn'] = df['dtcolumn'].apply(lambda x: round_time(x))
您可以使用 round(freq)
. There is also a shortcut column.dt
访问日期时间函数(正如@laurens-koppenol 建议的那样)。
这是一条线:
df['old column'].dt.round('15min')
可以找到有效频率的字符串别名 here。完整的工作示例:
In [1]: import pandas as pd
In [2]: df = pd.DataFrame([pd.Timestamp('2015-07-18 13:53:33.280'),
pd.Timestamp('2015-07-18 13:33:33.330')],
columns=['old column'])
In [3]: df['new column']=df['old column'].dt.round('15min')
In [4]: df
Out[4]:
old column new column
0 2015-07-18 13:53:33.280 2015-07-18 14:00:00
1 2015-07-18 13:33:33.330 2015-07-18 13:30:00
这个看起来好看一点
column.dt.
允许日期时间列的日期时间函数,就像 column.str.
对类似字符串的列所做的一样
datetime-like properties API reference
import pandas as pd
# test df
df = pd.DataFrame([{'old_column':pd.Timestamp('2015-07-18 13:53:33.280')}])
df['new_column'] = df['old_column'].dt.round('15min')
df
我已将数据文件加载到 Python pandas 数据帧中。我有一个 2015-07-18 13:53:33.280
格式的日期时间列。
我需要做的是创建一个新列,将其四舍五入到最接近的刻钟。因此,上述日期将四舍五入为 2015-07-18 13:45:00.000
.
如何在 pandas 中执行此操作?我尝试使用 here 中的解决方案,但出现 'Series' object has no attribute 'year'
错误。
假设您的系列由 datetime
个对象组成,您需要使用 Series.apply
。示例 -
import datetime
df['<column>'] = df['<column>'].apply(lambda dt: datetime.datetime(dt.year, dt.month, dt.day, dt.hour,15*(dt.minute // 15)))
上面的例子总是四舍五入到前一刻钟(行为类似于 floor 函数)。
编辑
四舍五入到正确的刻钟(如 ,如果它是上一季度的 7 分 30 秒,则显示下一季度)。我们可以使用下面的例子 -
import datetime
df['<column>'] = df['<column>'].apply(lambda dt: datetime.datetime(dt.year, dt.month, dt.day, dt.hour,15*round((float(dt.minute) + float(dt.second)/60) / 15)))
以上只会考虑最近的秒数,如果你想考虑 millisecond/microsecond,你可以将其添加到上面的等式中 - (float(dt.minute) + float(dt.second)/60 + float(dt.microsecond)/60000000)
Anand S Kumar 的回答没有四舍五入到最接近的刻钟,而是将分钟截断到最接近的 15 分钟以下。
实际上,在您的示例中,2015-07-18 13:53:33.280
应该四舍五入为 2015-07-18 14:00:00.000
,因为 53:33.280
比 45 分钟更接近 60 分钟。
我在 this post 中找到了更可靠的舍入答案。
对于您的情况,这应该可行:
import datetime
def round_time(time, round_to):
"""roundTo is the number of minutes to round to"""
rounded = time + datetime.timedelta(minutes=round_to/2.)
rounded -= datetime.timedelta(minutes=rounded.minute % round_to,
seconds=rounded.second,
microseconds=rounded.microsecond)
return rounded
dt['dtcolumn'] = df['dtcolumn'].apply(lambda x: round_time(x))
您可以使用 round(freq)
. There is also a shortcut column.dt
访问日期时间函数(正如@laurens-koppenol 建议的那样)。
这是一条线:
df['old column'].dt.round('15min')
可以找到有效频率的字符串别名 here。完整的工作示例:
In [1]: import pandas as pd
In [2]: df = pd.DataFrame([pd.Timestamp('2015-07-18 13:53:33.280'),
pd.Timestamp('2015-07-18 13:33:33.330')],
columns=['old column'])
In [3]: df['new column']=df['old column'].dt.round('15min')
In [4]: df
Out[4]:
old column new column
0 2015-07-18 13:53:33.280 2015-07-18 14:00:00
1 2015-07-18 13:33:33.330 2015-07-18 13:30:00
这个看起来好看一点
column.dt.
允许日期时间列的日期时间函数,就像 column.str.
对类似字符串的列所做的一样
datetime-like properties API reference
import pandas as pd
# test df
df = pd.DataFrame([{'old_column':pd.Timestamp('2015-07-18 13:53:33.280')}])
df['new_column'] = df['old_column'].dt.round('15min')
df