计算一行中不同变量的数量
Count number of different variables in a row
我有一个关于清洁 data/checking 观察的问题。由于隐私问题,我不能分享完整的代码或数据。我可以用一个例子来说明我想要实现的目标。假设这是我的数据集。
Individual
Year
101
2018
101
2019
102
2019
103
2019
104
2017
104
2018
104
2019
假设我想计算这个数据集中不同个体的数量。那么,在这种情况下,它将是 4('101'、'102'、'103'、'104')。但是,我有这个非常广泛的方式。有没有简单的方法来检查整个数据集有多少人?
希望有人能提供帮助 :) 我认为应该有一个简单的解决方案,但谷歌搜索到目前为止没有帮助。
这是您的示例数据:
data <- data.frame(Individual = c(101, 101, 102, 103, 104, 104, 104),
Year = c("2018", "2019", "2019", "2019", "2017", "2018", "2019"))
看起来像这样:
Individual Year
1 101 2018
2 101 2019
3 102 2019
4 103 2019
5 104 2017
6 104 2018
7 104 2019
要计算列中唯一值的数量,可以使用以下代码:
length(unique(data$Individual))
输出为:
[1] 4
本例中输出为 4。
我有一个关于清洁 data/checking 观察的问题。由于隐私问题,我不能分享完整的代码或数据。我可以用一个例子来说明我想要实现的目标。假设这是我的数据集。
Individual | Year |
---|---|
101 | 2018 |
101 | 2019 |
102 | 2019 |
103 | 2019 |
104 | 2017 |
104 | 2018 |
104 | 2019 |
假设我想计算这个数据集中不同个体的数量。那么,在这种情况下,它将是 4('101'、'102'、'103'、'104')。但是,我有这个非常广泛的方式。有没有简单的方法来检查整个数据集有多少人?
希望有人能提供帮助 :) 我认为应该有一个简单的解决方案,但谷歌搜索到目前为止没有帮助。
这是您的示例数据:
data <- data.frame(Individual = c(101, 101, 102, 103, 104, 104, 104),
Year = c("2018", "2019", "2019", "2019", "2017", "2018", "2019"))
看起来像这样:
Individual Year
1 101 2018
2 101 2019
3 102 2019
4 103 2019
5 104 2017
6 104 2018
7 104 2019
要计算列中唯一值的数量,可以使用以下代码:
length(unique(data$Individual))
输出为:
[1] 4
本例中输出为 4。