在数据帧列表中组合日期和时间(时间戳)
Combining date and time (timestamp) in a list of dataframes
我希望将日期和时间合并到数据帧列表中的一个时间戳中,并指定调用日期的一周。
这是错误:
ValueError:无法将字符串转换为时间戳
我使用了以下功能:
def new_call_time(df):
i=0
df[' CALL_DATE_MANIPULATED']=str(df['CALL_DATE'][i]).split()[0] + ' ' + str(df['CALL_TIME'][i])
df[' UNIX_TIME']= pd.Timestamp(df[' CALL_DATE_MANIPULATED'][i]).value//10 ** 9
df[' WEEK']=''
for i in range(len(df)):
df[' CALL_DATE_MANIPULATED'][i]=str(df['CALL_DATE'][i]).split()[0] + ' ' + str(df['CALL_TIME'][i])
df[' UNIX_TIME'][i]= pd.Timestamp(df[' CALL_DATE_MANIPULATED'][i]).value// 10 ** 9
df[' WEEK'][i]=df[' UNIX_TIME'][i]//604800
return df
函数调用语句如下:
for df in data_frame :
df = new_call_time(df)
这是我从 excel 表格中读取的表格(包含在名为 data_frame 的列表中):
CALL_DATE CALL_TIME
01-JAN-2016 00:15:06
01-JAN-2016 07:07:00
CALL_DATE CALL_TIME
01-JAN-2016 08:40:38
01-JAN-2016 08:44:14
CALL_DATE CALL_TIME
01-JAN-2016 08:51:10
01-JAN-2016 09:06:31
这适用于单个数据帧,但不适用于数据帧列表。
新表也应该有以下列:
示例:data_frame[0] -
CALL_DATE CALL_TIME CALL_DATE_MANIPULATED UNIX_TIME WEEK
01-JAN-2016 00:15:06 01-JAN-2016 00:15:06 1451607306 2400
01-JAN-2016 07:07:00 01-JAN-2016 07:07:00 1451632020 2400
非常感谢:)))
如果某些值与 format
中定义的格式不匹配,则将 Series.str.split
with indexing str[0]
and then to_datetime
与参数 errors='coerce'
一起用于 NaT
(参数格式是为了获得更好的性能,但应省略) :
def new_call_time(df):
df['CALL_DATE_MANIPULATED'] = (df['CALL_DATE'].astype(str).str.split().str[0] + ' ' +
df['CALL_TIME'].astype(str))
dates = pd.to_datetime(df['CALL_DATE_MANIPULATED'],
errors='coerce',
format='%d-%b-%Y %H:%M:%S')
df['UNIX_TIME'] = dates.values.astype(np.int64) // 10 ** 9
df['WEEK'] = df['UNIX_TIME'] //604800
return df
在新的列表理解中调用函数 list of DataFrames
:
data_frame1 = [new_call_time(df) for df in data_frame]
我希望将日期和时间合并到数据帧列表中的一个时间戳中,并指定调用日期的一周。
这是错误: ValueError:无法将字符串转换为时间戳
我使用了以下功能:
def new_call_time(df):
i=0
df[' CALL_DATE_MANIPULATED']=str(df['CALL_DATE'][i]).split()[0] + ' ' + str(df['CALL_TIME'][i])
df[' UNIX_TIME']= pd.Timestamp(df[' CALL_DATE_MANIPULATED'][i]).value//10 ** 9
df[' WEEK']=''
for i in range(len(df)):
df[' CALL_DATE_MANIPULATED'][i]=str(df['CALL_DATE'][i]).split()[0] + ' ' + str(df['CALL_TIME'][i])
df[' UNIX_TIME'][i]= pd.Timestamp(df[' CALL_DATE_MANIPULATED'][i]).value// 10 ** 9
df[' WEEK'][i]=df[' UNIX_TIME'][i]//604800
return df
函数调用语句如下:
for df in data_frame :
df = new_call_time(df)
这是我从 excel 表格中读取的表格(包含在名为 data_frame 的列表中):
CALL_DATE CALL_TIME
01-JAN-2016 00:15:06
01-JAN-2016 07:07:00
CALL_DATE CALL_TIME
01-JAN-2016 08:40:38
01-JAN-2016 08:44:14
CALL_DATE CALL_TIME
01-JAN-2016 08:51:10
01-JAN-2016 09:06:31
这适用于单个数据帧,但不适用于数据帧列表。
新表也应该有以下列: 示例:data_frame[0] -
CALL_DATE CALL_TIME CALL_DATE_MANIPULATED UNIX_TIME WEEK
01-JAN-2016 00:15:06 01-JAN-2016 00:15:06 1451607306 2400
01-JAN-2016 07:07:00 01-JAN-2016 07:07:00 1451632020 2400
非常感谢:)))
如果某些值与 format
中定义的格式不匹配,则将 Series.str.split
with indexing str[0]
and then to_datetime
与参数 errors='coerce'
一起用于 NaT
(参数格式是为了获得更好的性能,但应省略) :
def new_call_time(df):
df['CALL_DATE_MANIPULATED'] = (df['CALL_DATE'].astype(str).str.split().str[0] + ' ' +
df['CALL_TIME'].astype(str))
dates = pd.to_datetime(df['CALL_DATE_MANIPULATED'],
errors='coerce',
format='%d-%b-%Y %H:%M:%S')
df['UNIX_TIME'] = dates.values.astype(np.int64) // 10 ** 9
df['WEEK'] = df['UNIX_TIME'] //604800
return df
在新的列表理解中调用函数 list of DataFrames
:
data_frame1 = [new_call_time(df) for df in data_frame]