向 ggplot 添加 1000 条回归线的最佳方法是什么? (基于模型的引导)

What is the best way to add 1000 regression lines to a ggplot? (Model-based bootstrapping)

从引导模型中,我有 1000 组回归模型的系数:

y = b0 + b1x + b2(x^2)

如果我已经有了系数,绘制二次线的函数调用是什么 I.E.我不想 "fit" 对我的数据使用线性模型。

我尝试通过 for 循环向我的 ggplot 对象添加行:

for (i in 1:1000) { 
  reg_line <- stat_function(fun=function(x) quad$coefficients[1] + 
                                      quad$coefficients[i,2]*x + quad$coefficients[i,3]*(x**2))
  reg_lines <- reg_lines + reg_line}

那没用 - 它似乎只在循环中添加了最后一行。

我想在我的图中添加 1000 条回归线的原因是因为这是一个家庭作业问题 - 我很清楚这不是一个常见的用例。

可能还有其他方法可以做到这一点,但希望这能给你一些想法。我使用了 mtcars 数据集并生成了一些 bootstrap 样本用于建模。您可以跳过这一步。

library(ggplot2)
library(tidyr)
library(dplyr)

data(mtcars)

drat=seq(min(mtcars$drat), max(mtcars$drat), length.out=100)

# Bootstrap function
bs <- function() {
  df = mtcars[sample(1:nrow(mtcars), replace=TRUE),]
  lm_fit <- lm(mpg ~ drat+I(drat^2), data=df)
  data.frame(Model=predict(lm_fit, newdata=data.frame(drat))) # Replace with your own
}

foo <- replicate(10, bs()) # Simulate

您将从这里开始,因为您应该已经拥有来自 1,000 个 bootstrap 模型的数据框或预测值列表。将其重塑为非常长的形式,为 geom_line 函数创建一个分组列。


foo_long <- data.frame(foo, drat) %>%
  pivot_longer(cols=-drat, names_to="Model", values_to="mpg")

ggplot(data = mtcars, aes(x = drat, y = mpg)) + 
  geom_point(color='blue') +
  geom_line(data = foo_long, aes(x=drat, y=mpg, group=Model, color=Model)) +
  guides(color=FALSE)