如何创建一个列或摘要 table 来列出某个值具有的可用数据年份?
How can I create a column or summary table that lists the available years of data that a value has?
所以我有以下看起来像这样的数据(它是一个样本,在大约 15 年的时间跨度内有数百行)。我想创建一个列(或摘要 table)来显示每个位置可用数据的年份。
Year, Place
2000, 'Adak'
2000, 'Kodiak'
2000, 'Saltsdale'
2001, 'Adak'
2001, 'Saltsdale'
2001, 'Tawney'
2002, 'Adak'
2002, 'Kodiak'
2002, 'Tawney'
如果可能的话,我真的很希望它看起来像这样:
Place, Years_Available
'Adak', 2000/2002
'Kodiak', 2000/2002
'Saltsdale', 2000/2001
'Tawney', 2001/2002
我用过 summarize_all 但它给了我一个奇怪的输出,其中 Years_Available 列只是重复第一年 15 次。
b1 <- b %>%
group_by(Place) %>%
mutate(years = toString(Year)) %>%
group_by(Place,years) %>%
summarize_all(funs(sum(!is.na(.))))
我们可以使用range
df1 %>%
group_by(Place) %>%
summarise(Year = toString(range(Year)))
所以我有以下看起来像这样的数据(它是一个样本,在大约 15 年的时间跨度内有数百行)。我想创建一个列(或摘要 table)来显示每个位置可用数据的年份。
Year, Place
2000, 'Adak'
2000, 'Kodiak'
2000, 'Saltsdale'
2001, 'Adak'
2001, 'Saltsdale'
2001, 'Tawney'
2002, 'Adak'
2002, 'Kodiak'
2002, 'Tawney'
如果可能的话,我真的很希望它看起来像这样:
Place, Years_Available
'Adak', 2000/2002
'Kodiak', 2000/2002
'Saltsdale', 2000/2001
'Tawney', 2001/2002
我用过 summarize_all 但它给了我一个奇怪的输出,其中 Years_Available 列只是重复第一年 15 次。
b1 <- b %>%
group_by(Place) %>%
mutate(years = toString(Year)) %>%
group_by(Place,years) %>%
summarize_all(funs(sum(!is.na(.))))
我们可以使用range
df1 %>%
group_by(Place) %>%
summarise(Year = toString(range(Year)))