组合来自两个不同列的两个值并打印唯一值和唯一值的计数
combining two values from two different columns and print unique values and count of unique values
我有一个数据框,其中有两列,每列各有 5 个值,我想合并两列中的所有值并打印所有唯一值并计算唯一值的数量
例子
第 1 列 - 'Fruits 1' - 具有以下值 [Apple、Orange、Banana、Grapes、Mango]
第 2 列 - 'Fruits 2' - 具有以下值 [Apricot, Avocado, Blackberries, Grapes, Mango]
现在我想合并两列中的值并打印所有唯一值,并且还想在合并时计算唯一值
预期结果 = [苹果、橙子、香蕉、葡萄、芒果、杏子、鳄梨、黑莓]
唯一值计数 = 8
谁能帮我写代码
您可以在底层 numpy 数组上使用 set
:
set(df[['Fruits 1', 'Fruits 2']].values.ravel())
输出:
{'Apple',
'Apricot',
'Avocado',
'Banana',
'Blackberries',
'Grapes',
'Mango',
'Orange'}
长度:
len(set(df[['Fruits 1', 'Fruits 2']].values.ravel()))
输出:8
我有一个数据框,其中有两列,每列各有 5 个值,我想合并两列中的所有值并打印所有唯一值并计算唯一值的数量
例子
第 1 列 - 'Fruits 1' - 具有以下值 [Apple、Orange、Banana、Grapes、Mango]
第 2 列 - 'Fruits 2' - 具有以下值 [Apricot, Avocado, Blackberries, Grapes, Mango]
现在我想合并两列中的值并打印所有唯一值,并且还想在合并时计算唯一值
预期结果 = [苹果、橙子、香蕉、葡萄、芒果、杏子、鳄梨、黑莓]
唯一值计数 = 8
谁能帮我写代码
您可以在底层 numpy 数组上使用 set
:
set(df[['Fruits 1', 'Fruits 2']].values.ravel())
输出:
{'Apple',
'Apricot',
'Avocado',
'Banana',
'Blackberries',
'Grapes',
'Mango',
'Orange'}
长度:
len(set(df[['Fruits 1', 'Fruits 2']].values.ravel()))
输出:8