如何循环glm
How to loop glm
我想循环 ridge & lasso 100 次以获得 100 mse 和 mspe。我的最终目标是绘制一个箱线图来比较这 100 个值。我做了一个回归模型,但我不知道如何重复这个模型。
我怎样才能得到值和箱线图?
您可以尝试以下方法:
ntimes <- 100
res <- replicate(ntimes, {
cv.rr <- cv.glmnet(x=as.matrix(train[,-1]),y=as.numeric(train[,1]),alpha=0,nfolds=10,nlambda=100, intercept=FALSE)
lambda.rr=cv.rr$lambda.min
mse.rr <- mean((coef(cv.rr)[-1] - betas.true)^2)
yhat.rr <- predict(cv.rr,s="lambda.min",newx=as.matrix(test[,-1]))
mspe.rr <- mean((test[,1]-yhat.rr)^2)
list(mse=mse.rr, mspe=mspe.rr)
})
library(tidyverse)
res_df <- as.data.frame(apply(res, 1, function(x) unlist(x)))
names(res_df) <- c('mse', 'mspe')
res_df %>% gather(key='metric', value='value') %>% ggplot(aes(value, fill=metric)) + geom_boxplot()
获得如下所示的可视化效果:
我想循环 ridge & lasso 100 次以获得 100 mse 和 mspe。我的最终目标是绘制一个箱线图来比较这 100 个值。我做了一个回归模型,但我不知道如何重复这个模型。 我怎样才能得到值和箱线图?
您可以尝试以下方法:
ntimes <- 100
res <- replicate(ntimes, {
cv.rr <- cv.glmnet(x=as.matrix(train[,-1]),y=as.numeric(train[,1]),alpha=0,nfolds=10,nlambda=100, intercept=FALSE)
lambda.rr=cv.rr$lambda.min
mse.rr <- mean((coef(cv.rr)[-1] - betas.true)^2)
yhat.rr <- predict(cv.rr,s="lambda.min",newx=as.matrix(test[,-1]))
mspe.rr <- mean((test[,1]-yhat.rr)^2)
list(mse=mse.rr, mspe=mspe.rr)
})
library(tidyverse)
res_df <- as.data.frame(apply(res, 1, function(x) unlist(x)))
names(res_df) <- c('mse', 'mspe')
res_df %>% gather(key='metric', value='value') %>% ggplot(aes(value, fill=metric)) + geom_boxplot()
获得如下所示的可视化效果: