计算一行中不同变量的数量

Question

我有一个关于清洁 data/checking 观察的问题。由于隐私问题，我不能分享完整的代码或数据。我可以用一个例子来说明我想要实现的目标。假设这是我的数据集。

Individual	Year
101	2018
101	2019
102	2019
103	2019
104	2017
104	2018
104	2019

假设我想计算这个数据集中不同个体的数量。那么，在这种情况下，它将是 4（'101'、'102'、'103'、'104'）。但是，我有这个非常广泛的方式。有没有简单的方法来检查整个数据集有多少人？

希望有人能提供帮助 :) 我认为应该有一个简单的解决方案，但谷歌搜索到目前为止没有帮助。

Answer 1

这是您的示例数据：

data <- data.frame(Individual = c(101, 101, 102, 103, 104, 104, 104),
                   Year = c("2018", "2019", "2019", "2019", "2017", "2018", "2019"))

看起来像这样：

  Individual Year
1        101 2018
2        101 2019
3        102 2019
4        103 2019
5        104 2017
6        104 2018
7        104 2019

要计算列中唯一值的数量，可以使用以下代码：

length(unique(data$Individual))

输出为：

[1] 4

本例中输出为 4。

计算一行中不同变量的数量

Count number of different variables in a row

row

r

count