Pandas:查找和编写唯一事件的简洁方法
Pandas: concise way of finding and writing unique occurrences
对于这样的数据框:
Col1
Col2
1
A
D
2
B
A
3
C
B
期望的结果:
Col1 和 Col2 中值的唯一出现次数(按行出现顺序)
即unique_list = [A, D, B, C]
问题
根据数据帧的数量和大小最大限度地减少迭代和处理的方法
使用DataFrame.iloc
for select first 2 columns, reshape by DataFrame.stack
and get unique values in Series.unique
:
unique_list = df.iloc[:, :2].stack().unique().tolist()
print (unique_list)
['A', 'D', 'B', 'C']
对于这样的数据框:
Col1 | Col2 | |
---|---|---|
1 | A | D |
2 | B | A |
3 | C | B |
期望的结果:
Col1 和 Col2 中值的唯一出现次数(按行出现顺序)
即unique_list = [A, D, B, C]
问题
根据数据帧的数量和大小最大限度地减少迭代和处理的方法
使用DataFrame.iloc
for select first 2 columns, reshape by DataFrame.stack
and get unique values in Series.unique
:
unique_list = df.iloc[:, :2].stack().unique().tolist()
print (unique_list)
['A', 'D', 'B', 'C']