按顺序将大数据帧分成较小的子数据帧
Divide a large dataframe into smaller sub dataframes in order
有什么办法可以将非常大的数据帧等分成较小的5个子数据帧吗?我不能使用火车测试拆分,因为它没有按顺序保存数据。
已存在的解决方案 Split a large pandas dataframe。它不符合我的目的。我试过了,它给出了下面提到的输出,这是不需要的 output.Input is
new_dict1 = {'ABW':{'ABR':1,'BPR':1,'CBR':1,'DBR':0},'BCW':{'ABR':0,'BPR':0,'CBR':1,'DBR':0},
'CBW':{'ABR':1,'BPR':1,'CBR':0,'DBR':0},'MCW':{'ABR':1,'BPR':1,'CBR':0,'DBR':1},
'DBW':{'ABR':0,'BPR':0,'CBR':1,'DBR':0},'MNW':{'ABR':0,'BPR':0,'CBR':1,'DBR':0},
'RBW':{'ABR':0,'BPR':0,'CBR':1,'DBR':0},'EBW':{'ABR':0,'BPR':0,'CBR':1,'DBR':0},
'GBW':{'ABR':0,'BPR':0,'CBR':1,'DBR':0},'HBW':{'ABR':0,'BPR':0,'CBR':1,'DBR':0}}
import pandas as pd
df2 = pd.DataFrame.from_dict(new_dict1,orient="index")
我得到的输出是
[ ABR BPR CBR DBR
ABW 1 1 1 0
BCW 0 0 1 0
CBW 1 1 0 0
MCW 1 1 0 1
DBW 0 0 1 0, ABR BPR CBR DBR
MNW 0 0 1 0
RBW 0 0 1 0
EBW 0 0 1 0
GBW 0 0 1 0
HBW 0 0 1 0]
这不是想要的输出。期望的输出是将大数据帧分成五个子数据场。
关注我的评论。这是一个例子,注意它可能不是最好的方法..:[=11=]
import numpy as np
dfs = np.array_split(df2, 5)
for index, df in enumerate(dfs):
globals()['df%s' % index] = pd.DataFrame(df)
df3
有什么办法可以将非常大的数据帧等分成较小的5个子数据帧吗?我不能使用火车测试拆分,因为它没有按顺序保存数据。 已存在的解决方案 Split a large pandas dataframe。它不符合我的目的。我试过了,它给出了下面提到的输出,这是不需要的 output.Input is
new_dict1 = {'ABW':{'ABR':1,'BPR':1,'CBR':1,'DBR':0},'BCW':{'ABR':0,'BPR':0,'CBR':1,'DBR':0},
'CBW':{'ABR':1,'BPR':1,'CBR':0,'DBR':0},'MCW':{'ABR':1,'BPR':1,'CBR':0,'DBR':1},
'DBW':{'ABR':0,'BPR':0,'CBR':1,'DBR':0},'MNW':{'ABR':0,'BPR':0,'CBR':1,'DBR':0},
'RBW':{'ABR':0,'BPR':0,'CBR':1,'DBR':0},'EBW':{'ABR':0,'BPR':0,'CBR':1,'DBR':0},
'GBW':{'ABR':0,'BPR':0,'CBR':1,'DBR':0},'HBW':{'ABR':0,'BPR':0,'CBR':1,'DBR':0}}
import pandas as pd
df2 = pd.DataFrame.from_dict(new_dict1,orient="index")
我得到的输出是
[ ABR BPR CBR DBR
ABW 1 1 1 0
BCW 0 0 1 0
CBW 1 1 0 0
MCW 1 1 0 1
DBW 0 0 1 0, ABR BPR CBR DBR
MNW 0 0 1 0
RBW 0 0 1 0
EBW 0 0 1 0
GBW 0 0 1 0
HBW 0 0 1 0]
这不是想要的输出。期望的输出是将大数据帧分成五个子数据场。
关注我的评论。这是一个例子,注意它可能不是最好的方法..:[=11=]
import numpy as np
dfs = np.array_split(df2, 5)
for index, df in enumerate(dfs):
globals()['df%s' % index] = pd.DataFrame(df)
df3