生成带有约束的示例数据框
Generate Sample dataframes with constraints
我有一个记录数据框,如下所示:
'Location' 'Rec ID' 'Duration' 'Rec-X'
0 Houston 126 17 [0.2, 0.34, 0.45, ..., 0.28]
1 Chicago 126 19.3 [0.12, 0.3, 0.41, ..., 0.39]
2 Boston 348 17.3 [0.12, 0.3, 0.41, ..., 0.39]
3 Chicago 138 12.3 [0.12, 0.3, 0.41, ..., 0.39]
4 New York 238 11.3 [0.12, 0.3, 0.41, ..., 0.39]
...
500 Chicago 126 19.3 [0.12, 0.3, 0.41, ..., 0.39]
作为遗传算法过程的一部分,我想初始化一组 (10) 个记录。我希望我的每个子集都包含 10 条记录,但是我不想两次包含相同的 'Rec-ID'。
知道如何生成这 10 个不同的数据帧吗?
谢谢,
您可以根据数据框中的列删除重复项,然后访问 10 个元素
df2 = df.drop_duplicates('Rec ID')
df2.head(10)
编辑
如果你想 select 随机 10 个独特的元素
然后像这样的东西会起作用
def selectRandomUnique(df) :
d2 = df.sample(n=3).drop_duplicates('ID')
while len(d2) != 3 :
d2 = df.sample(n=3).drop_duplicates('ID')
return d2
首先,您随机 select 行,然后删除可能存在的任何重复项。
我有一个记录数据框,如下所示:
'Location' 'Rec ID' 'Duration' 'Rec-X'
0 Houston 126 17 [0.2, 0.34, 0.45, ..., 0.28]
1 Chicago 126 19.3 [0.12, 0.3, 0.41, ..., 0.39]
2 Boston 348 17.3 [0.12, 0.3, 0.41, ..., 0.39]
3 Chicago 138 12.3 [0.12, 0.3, 0.41, ..., 0.39]
4 New York 238 11.3 [0.12, 0.3, 0.41, ..., 0.39]
...
500 Chicago 126 19.3 [0.12, 0.3, 0.41, ..., 0.39]
作为遗传算法过程的一部分,我想初始化一组 (10) 个记录。我希望我的每个子集都包含 10 条记录,但是我不想两次包含相同的 'Rec-ID'。
知道如何生成这 10 个不同的数据帧吗?
谢谢,
您可以根据数据框中的列删除重复项,然后访问 10 个元素
df2 = df.drop_duplicates('Rec ID')
df2.head(10)
编辑 如果你想 select 随机 10 个独特的元素 然后像这样的东西会起作用
def selectRandomUnique(df) :
d2 = df.sample(n=3).drop_duplicates('ID')
while len(d2) != 3 :
d2 = df.sample(n=3).drop_duplicates('ID')
return d2
首先,您随机 select 行,然后删除可能存在的任何重复项。