R - 根据使用另一列的函数为一列添加值
R - adding values for one column based on a function using another column
我有一个看起来像这样的数据集
head(dataset)
Distance Lag time Kurtosis
7.406100 10
144.1700 1
77.31800 1
81.15400 1
4.249167 6
我想将值添加到 峰度 列。要计算峰度,我需要按滞后时间对距离进行分组(即,滞后时间 1 的所有距离都会给我一个峰度值等)。
为了获得峰度,我通常使用包 "psych" 和函数 describe()
我可以添加一种循环来执行此操作吗?
您应该可以使用 dplyr
执行此操作
library(dplyr)
library(magrittr)
dataset <- dataset %>%
dplyr::group_by('Lag time') %>%
dplyr::mutate(Kurtosis = describe(Distance)$kurtosis)
由于 describe
生成一个数据框作为输出,而你想要的只是一列(也称为峰度),你需要对 describe
输出
进行子集化
library(dplyr)
library(psych)
df %>%
group_by(Lag_Time) %>%
mutate(Kurtosis = describe(Distance)[1,"kurtosis"])
Distance Lag_Time Kurtosis
<dbl> <dbl> <dbl>
1 7.41 10 NA
2 144. 1 -2.33
3 77.3 1 -2.33
4 81.2 1 -2.33
5 4.25 6 NA
我有一个看起来像这样的数据集
head(dataset)
Distance Lag time Kurtosis
7.406100 10
144.1700 1
77.31800 1
81.15400 1
4.249167 6
我想将值添加到 峰度 列。要计算峰度,我需要按滞后时间对距离进行分组(即,滞后时间 1 的所有距离都会给我一个峰度值等)。 为了获得峰度,我通常使用包 "psych" 和函数 describe() 我可以添加一种循环来执行此操作吗?
您应该可以使用 dplyr
library(dplyr)
library(magrittr)
dataset <- dataset %>%
dplyr::group_by('Lag time') %>%
dplyr::mutate(Kurtosis = describe(Distance)$kurtosis)
由于 describe
生成一个数据框作为输出,而你想要的只是一列(也称为峰度),你需要对 describe
输出
library(dplyr)
library(psych)
df %>%
group_by(Lag_Time) %>%
mutate(Kurtosis = describe(Distance)[1,"kurtosis"])
Distance Lag_Time Kurtosis
<dbl> <dbl> <dbl>
1 7.41 10 NA
2 144. 1 -2.33
3 77.3 1 -2.33
4 81.2 1 -2.33
5 4.25 6 NA