在 'best' lambda 获取 glmnet 系数

Question

我在 glmnet 中使用以下代码：

> library(glmnet)
> fit = glmnet(as.matrix(mtcars[-1]), mtcars[,1])
> plot(fit, xvar='lambda')

但是，我想打印出最好的 Lambda 系数，就像在岭回归中所做的那样。我看到以下适合结构：

> str(fit)
List of 12
 $ a0       : Named num [1:79] 20.1 21.6 23.2 24.7 26 ...
  ..- attr(*, "names")= chr [1:79] "s0" "s1" "s2" "s3" ...
 $ beta     :Formal class 'dgCMatrix' [package "Matrix"] with 6 slots
  .. ..@ i       : int [1:561] 0 4 0 4 0 4 0 4 0 4 ...
  .. ..@ p       : int [1:80] 0 0 2 4 6 8 10 12 14 16 ...
  .. ..@ Dim     : int [1:2] 10 79
  .. ..@ Dimnames:List of 2
  .. .. ..$ : chr [1:10] "cyl" "disp" "hp" "drat" ...
  .. .. ..$ : chr [1:79] "s0" "s1" "s2" "s3" ...
  .. ..@ x       : num [1:561] -0.0119 -0.4578 -0.1448 -0.7006 -0.2659 ...
  .. ..@ factors : list()
 $ df       : int [1:79] 0 2 2 2 2 2 2 2 2 3 ...
 $ dim      : int [1:2] 10 79
 $ lambda   : num [1:79] 5.15 4.69 4.27 3.89 3.55 ...
 $ dev.ratio: num [1:79] 0 0.129 0.248 0.347 0.429 ...
 $ nulldev  : num 1126
 $ npasses  : int 1226
 $ jerr     : int 0
 $ offset   : logi FALSE
 $ call     : language glmnet(x = as.matrix(mtcars[-1]), y = mtcars[, 1])
 $ nobs     : int 32
 - attr(*, "class")= chr [1:2] "elnet" "glmnet"

但是我无法得到最好的Lambda和相应的系数。感谢您的帮助。

Answer 1

试试这个：

fit = glmnet(as.matrix(mtcars[-1]), mtcars[,1], 
    lambda=cv.glmnet(as.matrix(mtcars[-1]), mtcars[,1])$lambda.1se)
coef(fit)

或者您可以在 coef 中指定一个 lambda 值：

fit = glmnet(as.matrix(mtcars[-1]), mtcars[,1])
coef(fit, s = cv.glmnet(as.matrix(mtcars[-1]), mtcars[,1])$lambda.1se)

你需要选择一个 "best" lambda，而 lambda.1se 是一个合理的，或者说是合理的，选择一个。但是您可以使用 cv.glmnet(as.matrix(mtcars[-1]), mtcars[,1])$lambda.min 或您确定为 "best" 的任何其他 lambda 值。

Answer 2

boxcox(){MASS} 提供了一个 maximum-likelihood 图显示 l 的哪个值最适合线性模型

boxcox(lm.fit) 提供 maximum-likelihood 图线性模型中 l 的范围很广

lm.fit 选择 l 与最高 ML 值

boxcox(lm.fit,lambda=seq(-0.1, 0.1, 0.01)) 如果，对于例如，最高的 l 约为 0.04，放大图那个区域

在示例中，函数提供了 l =- 之间的绘图 0.1 和 0.1，增量为 0.01。

Answer 3

要提取最佳 lambda，您可以键入 fit$lambda.min

要获得对应于最佳lambda的系数，请使用coef(fit, s = fit$lambda.min) - 请参考Glmnet vignette的第6页。

我认为这些系数是由适合 完整数据 的模型产生的，而不仅仅是测试集，如 .

中所述

在 'best' lambda 获取 glmnet 系数

Getting glmnet coefficients at 'best' lambda

regression

r

glmnet

coefficients