R中的数据帧从宽格式重组为两列
Data frame restructure in R from wide format to two columns
我正在处理一个数据集,该数据集有 4 列,代表某个森林补丁何时被砍伐。
其中三列代表一年,每行代表一个月。例如列:2015 年,行:1 = 2015 年 1 月
最后一列是每个站点的唯一 ID。
对于我的分析,我需要重组此数据,使其成为 2 行、站点和用于剪切的日期格式。由于我们不知道确切的日期,因此我们选择每个月的 15 日作为代理。
我附上了数据照片和摘要。
我想要的最终结果是这样的
uniqueid <- c(21000, 23400, 26800)
cut <- as.Date(c('2015-1-15','2016-3-15','2017-3-15'))
stack_example <- data.frame(uniqueid, cut)
有人可以帮我重组数据,使其类似于示例输出吗?
非常感谢
<<<< 为 AKRUN 编辑 >>>>>
dput(head(clf))
structure(list(X2017 = c(NA_integer_, NA_integer_, NA_integer_,
NA_integer_, NA_integer_, NA_integer_), X2016 = c(NA_integer_,
NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_ ),
X2015 = c(NA_integer_, NA_integer_, NA_integer_, NA_integer_,
NA_integer_, NA_integer_), idunique = 1:6), row.names = c(NA, 6L),
class = "data.frame")
我们可以使用 pivot_longer
转换为长格式,然后使用 paste
或 str_c
或 sprintf
library(dplyr)
library(tidyr)
library(stringr)
clf %>%
pivot_longer(cols = -idunique, values_drop_na = TRUE,
names_to = 'date', values_to = 'value') %>%
transmute(idunique, cut = sprintf('%s-%02d-15',
str_remove(date, '^X'), value))
# A tibble: 1 x 2
# idunique cut
# <int> <chr>
#1 3 2017-03-15
数据
# OP's dput showed all rows NA. So, added a value for test
clf$X2017[3] <- 3
我正在处理一个数据集,该数据集有 4 列,代表某个森林补丁何时被砍伐。
其中三列代表一年,每行代表一个月。例如列:2015 年,行:1 = 2015 年 1 月
最后一列是每个站点的唯一 ID。
对于我的分析,我需要重组此数据,使其成为 2 行、站点和用于剪切的日期格式。由于我们不知道确切的日期,因此我们选择每个月的 15 日作为代理。
我附上了数据照片和摘要。
我想要的最终结果是这样的
uniqueid <- c(21000, 23400, 26800)
cut <- as.Date(c('2015-1-15','2016-3-15','2017-3-15'))
stack_example <- data.frame(uniqueid, cut)
有人可以帮我重组数据,使其类似于示例输出吗?
非常感谢
<<<< 为 AKRUN 编辑 >>>>>
dput(head(clf))
structure(list(X2017 = c(NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_), X2016 = c(NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_ ), X2015 = c(NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_), idunique = 1:6), row.names = c(NA, 6L), class = "data.frame")
我们可以使用 pivot_longer
转换为长格式,然后使用 paste
或 str_c
或 sprintf
library(dplyr)
library(tidyr)
library(stringr)
clf %>%
pivot_longer(cols = -idunique, values_drop_na = TRUE,
names_to = 'date', values_to = 'value') %>%
transmute(idunique, cut = sprintf('%s-%02d-15',
str_remove(date, '^X'), value))
# A tibble: 1 x 2
# idunique cut
# <int> <chr>
#1 3 2017-03-15
数据
# OP's dput showed all rows NA. So, added a value for test
clf$X2017[3] <- 3