复制数据集中的样本?
Duplicate the samples in a dataset?
我使用代码检查我的数据集 'df' 并发现列 'Has_Arrears' 严重不平衡。我会用 Has_Arrears = 1 下的重复样本扩展我的目标数据集 35 次。即对 Has_Arrears = 1 的每次观察采样 35 次。我怎样才能做到这一点?干杯
如果我想使用分层抽样,我该如何编码?
如果我没理解错的话,这可能就是您要查找的内容:
new = df['Has_Arrears'] == 1
a = df[new]
df = df.append([a]*35, ignore_index=True)
我使用代码检查我的数据集 'df' 并发现列 'Has_Arrears' 严重不平衡。我会用 Has_Arrears = 1 下的重复样本扩展我的目标数据集 35 次。即对 Has_Arrears = 1 的每次观察采样 35 次。我怎样才能做到这一点?干杯
如果我想使用分层抽样,我该如何编码?
如果我没理解错的话,这可能就是您要查找的内容:
new = df['Has_Arrears'] == 1
a = df[new]
df = df.append([a]*35, ignore_index=True)