将嵌套在因子级别内的数字转换为数字向量
Convert numbers nested inside levels of factor to numeric vector
经过大量搜索,我认为没有人问过这个问题,我认为这里有人可以找到比我更快的解决方法。
我有一个因子变量,其中每个 observation 包含 29 个嵌套数字:
dataframe$variable <- [1] -5.04849486 -4.17954852 -7.00735591 -3.93680666 -3.36135959 -5.89856992 -3.28262102 -4.95040133 -4.52287533 -6.55458896 -6.08302617 -5.45365319 -5.35542788 -6.49870823 -9.08663504 -10.83126787 -10.83991976 -10.96286352 -11.47911528 -11.45937234 -10.96341187 -12.33917811 -13.49123764 -13.09288624 -12.53887413 -12.66352061 -14.43587376 -14.96183082 -15.73399282
[2] -6.69620919 -7.40672798 -8.3530468 -7.91598217 -7.83297636 -8.37460146 -8.73916205 -9.20744225 -9.3282853 -9.50299118 -9.92630917 -10.24373155 -10.49520522 -10.41014364 -10.25805992 -10.52294616 -11.27053953 -11.85528256 -12.62743692 -13.35299167 -13.25576965 -13.56397075 -13.70361862 -13.97438053 -14.24976232 -14.10028664 -14.06066972 -14.57621329 -15.45692947
[3] -3.86805776 -2.57038981 -4.88910112 -3.82336021 -1.51641245 -4.19533412 -3.52909675 -3.86380061 -4.77176809 -4.84617525 -6.59760906 -7.02974036 -6.16868245 -6.74446232 -7.4624311 -7.93993982 -9.27617985 -10.12415032 -10.498118 -10.72502719 -10.71480081 -10.58232787 -11.24845809 -11.24984636 -10.72254205 -11.23331293 -12.7042161 -13.16813511 -14.49287153
etc.
现在我需要在变量中的每个观察值之间执行一些基本计算(例如 diff <- [1] - [2])。所以我不想取消列出观察中的每个数字。他们需要作为一个整体发挥作用。
如何将 "variable" 的每个级别转换为数值向量,以便计算观察值之间的差异?每个数字之间加逗号?强制转换?
编辑:询问如何转换数据结构,而不是执行计算。我已经写了那部分。
很难看出您拥有的确切数据结构(例如每个案例包含 3 个向量的列表?),但这种方法或小的修改可能有效:
library(tidyverse)
dataframe <-
dataframe %>%
# data extracted to a vector
mutate(variable_sep = str_extract_all(variable, "[-0-9\.]+")) %>%
# convert to a numeric vector
mutate(variable_numeric = map(variable_sep, ~as.numeric(.x)))
以上解决方案是"tidyverse"语法。
这是常规的基本 R 语法。
dataframe$variable_sep <- str_extract_all(dataframe$variable, "[-0-9\.]+")
dataframe$variable_numeric <- lapply(dataframe$variable_sep , FUN = as.numeric)
经过大量搜索,我认为没有人问过这个问题,我认为这里有人可以找到比我更快的解决方法。
我有一个因子变量,其中每个 observation 包含 29 个嵌套数字:
dataframe$variable <- [1] -5.04849486 -4.17954852 -7.00735591 -3.93680666 -3.36135959 -5.89856992 -3.28262102 -4.95040133 -4.52287533 -6.55458896 -6.08302617 -5.45365319 -5.35542788 -6.49870823 -9.08663504 -10.83126787 -10.83991976 -10.96286352 -11.47911528 -11.45937234 -10.96341187 -12.33917811 -13.49123764 -13.09288624 -12.53887413 -12.66352061 -14.43587376 -14.96183082 -15.73399282
[2] -6.69620919 -7.40672798 -8.3530468 -7.91598217 -7.83297636 -8.37460146 -8.73916205 -9.20744225 -9.3282853 -9.50299118 -9.92630917 -10.24373155 -10.49520522 -10.41014364 -10.25805992 -10.52294616 -11.27053953 -11.85528256 -12.62743692 -13.35299167 -13.25576965 -13.56397075 -13.70361862 -13.97438053 -14.24976232 -14.10028664 -14.06066972 -14.57621329 -15.45692947
[3] -3.86805776 -2.57038981 -4.88910112 -3.82336021 -1.51641245 -4.19533412 -3.52909675 -3.86380061 -4.77176809 -4.84617525 -6.59760906 -7.02974036 -6.16868245 -6.74446232 -7.4624311 -7.93993982 -9.27617985 -10.12415032 -10.498118 -10.72502719 -10.71480081 -10.58232787 -11.24845809 -11.24984636 -10.72254205 -11.23331293 -12.7042161 -13.16813511 -14.49287153
etc.
现在我需要在变量中的每个观察值之间执行一些基本计算(例如 diff <- [1] - [2])。所以我不想取消列出观察中的每个数字。他们需要作为一个整体发挥作用。
如何将 "variable" 的每个级别转换为数值向量,以便计算观察值之间的差异?每个数字之间加逗号?强制转换?
编辑:询问如何转换数据结构,而不是执行计算。我已经写了那部分。
很难看出您拥有的确切数据结构(例如每个案例包含 3 个向量的列表?),但这种方法或小的修改可能有效:
library(tidyverse)
dataframe <-
dataframe %>%
# data extracted to a vector
mutate(variable_sep = str_extract_all(variable, "[-0-9\.]+")) %>%
# convert to a numeric vector
mutate(variable_numeric = map(variable_sep, ~as.numeric(.x)))
以上解决方案是"tidyverse"语法。 这是常规的基本 R 语法。
dataframe$variable_sep <- str_extract_all(dataframe$variable, "[-0-9\.]+")
dataframe$variable_numeric <- lapply(dataframe$variable_sep , FUN = as.numeric)