在数据帧列表中组合日期和时间(时间戳)

Combining date and time (timestamp) in a list of dataframes

我希望将日期和时间合并到数据帧列表中的一个时间戳中,并指定调用日期的一周。

这是错误: ValueError:无法将字符串转换为时间戳

我使用了以下功能:

def new_call_time(df):
    i=0
    df[' CALL_DATE_MANIPULATED']=str(df['CALL_DATE'][i]).split()[0] + ' ' + str(df['CALL_TIME'][i]) 
    df[' UNIX_TIME']= pd.Timestamp(df[' CALL_DATE_MANIPULATED'][i]).value//10 ** 9 
    df[' WEEK']=''

    for i in range(len(df)):
        df[' CALL_DATE_MANIPULATED'][i]=str(df['CALL_DATE'][i]).split()[0] + ' ' + str(df['CALL_TIME'][i])
        df[' UNIX_TIME'][i]= pd.Timestamp(df[' CALL_DATE_MANIPULATED'][i]).value// 10 ** 9
        df[' WEEK'][i]=df[' UNIX_TIME'][i]//604800

return df

函数调用语句如下:

for df in data_frame : 
    df = new_call_time(df)

这是我从 excel 表格中读取的表格(包含在名为 data_frame 的列表中):

    CALL_DATE    CALL_TIME
    01-JAN-2016  00:15:06   
    01-JAN-2016  07:07:00

    CALL_DATE    CALL_TIME
    01-JAN-2016  08:40:38   
    01-JAN-2016  08:44:14   

    CALL_DATE    CALL_TIME
    01-JAN-2016  08:51:10   
    01-JAN-2016  09:06:31

这适用于单个数据帧,但不适用于数据帧列表。

新表也应该有以下列: 示例:data_frame[0] -

     CALL_DATE       CALL_TIME  CALL_DATE_MANIPULATED UNIX_TIME  WEEK
     01-JAN-2016     00:15:06   01-JAN-2016 00:15:06  1451607306 2400   
     01-JAN-2016     07:07:00   01-JAN-2016 07:07:00  1451632020 2400

非常感谢:)))

如果某些值与 format 中定义的格式不匹配,则将 Series.str.split with indexing str[0] and then to_datetime 与参数 errors='coerce' 一起用于 NaT(参数格式是为了获得更好的性能,但应省略) :

def new_call_time(df):
    df['CALL_DATE_MANIPULATED'] = (df['CALL_DATE'].astype(str).str.split().str[0] + ' ' + 
                                   df['CALL_TIME'].astype(str))
    dates = pd.to_datetime(df['CALL_DATE_MANIPULATED'], 
                           errors='coerce', 
                           format='%d-%b-%Y %H:%M:%S')
    df['UNIX_TIME'] = dates.values.astype(np.int64) // 10 ** 9
    df['WEEK'] = df['UNIX_TIME'] //604800
    return df

在新的列表理解中调用函数 list of DataFrames:

data_frame1 = [new_call_time(df) for df in data_frame]