计算一行中不同变量的数量

Count number of different variables in a row

我有一个关于清洁 data/checking 观察的问题。由于隐私问题,我不能分享完整的代码或数据。我可以用一个例子来说明我想要实现的目标。假设这是我的数据集。

Individual Year
101 2018
101 2019
102 2019
103 2019
104 2017
104 2018
104 2019

假设我想计算这个数据集中不同个体的数量。那么,在这种情况下,它将是 4('101'、'102'、'103'、'104')。但是,我有这个非常广泛的方式。有没有简单的方法来检查整个数据集有多少人?

希望有人能提供帮助 :) 我认为应该有一个简单的解决方案,但谷歌搜索到目前为止没有帮助。

这是您的示例数据:

data <- data.frame(Individual = c(101, 101, 102, 103, 104, 104, 104),
                   Year = c("2018", "2019", "2019", "2019", "2017", "2018", "2019"))

看起来像这样:

  Individual Year
1        101 2018
2        101 2019
3        102 2019
4        103 2019
5        104 2017
6        104 2018
7        104 2019

要计算列中唯一值的数量,可以使用以下代码:

length(unique(data$Individual))

输出为:

[1] 4

本例中输出为 4。