如何计算数据框中唯一值的总数?
How do I calculate total number of unique values in a dataframe?
这是一个示例数据框:
>frame
X1 X2 X3 X4
1 F F F F
2 C C C C
3 D D D D
4 A# A# A# A#
当我 运行 unique(c(frame))
我得到一个包含四个唯一值的向量,"F"、"C"、"D"、"A#" .但是,如果我 运行 length(unique(c(frame)))
,我得到的长度为 1。所以我正在寻找一种方法来获取数据帧中以及数据帧的子集中唯一值的总数.
根据@DatamineR:
length(unique(unlist(df)))
除了 Python,我一直在努力解决与您相同的问题。在上面,我弄清楚了它是如何工作的,它看起来像这样:len(df['column'].unique())
这是一个示例数据框:
>frame
X1 X2 X3 X4
1 F F F F
2 C C C C
3 D D D D
4 A# A# A# A#
当我 运行 unique(c(frame))
我得到一个包含四个唯一值的向量,"F"、"C"、"D"、"A#" .但是,如果我 运行 length(unique(c(frame)))
,我得到的长度为 1。所以我正在寻找一种方法来获取数据帧中以及数据帧的子集中唯一值的总数.
根据@DatamineR:
length(unique(unlist(df)))
除了 Python,我一直在努力解决与您相同的问题。在上面,我弄清楚了它是如何工作的,它看起来像这样:len(df['column'].unique())