向 ggplot 添加 1000 条回归线的最佳方法是什么? (基于模型的引导)
What is the best way to add 1000 regression lines to a ggplot? (Model-based bootstrapping)
从引导模型中,我有 1000 组回归模型的系数:
y = b0 + b1x + b2(x^2)
如果我已经有了系数,绘制二次线的函数调用是什么? I.E.我不想 "fit" 对我的数据使用线性模型。
我尝试通过 for 循环向我的 ggplot 对象添加行:
for (i in 1:1000) {
reg_line <- stat_function(fun=function(x) quad$coefficients[1] +
quad$coefficients[i,2]*x + quad$coefficients[i,3]*(x**2))
reg_lines <- reg_lines + reg_line}
那没用 - 它似乎只在循环中添加了最后一行。
我想在我的图中添加 1000 条回归线的原因是因为这是一个家庭作业问题 - 我很清楚这不是一个常见的用例。
可能还有其他方法可以做到这一点,但希望这能给你一些想法。我使用了 mtcars 数据集并生成了一些 bootstrap 样本用于建模。您可以跳过这一步。
library(ggplot2)
library(tidyr)
library(dplyr)
data(mtcars)
drat=seq(min(mtcars$drat), max(mtcars$drat), length.out=100)
# Bootstrap function
bs <- function() {
df = mtcars[sample(1:nrow(mtcars), replace=TRUE),]
lm_fit <- lm(mpg ~ drat+I(drat^2), data=df)
data.frame(Model=predict(lm_fit, newdata=data.frame(drat))) # Replace with your own
}
foo <- replicate(10, bs()) # Simulate
您将从这里开始,因为您应该已经拥有来自 1,000 个 bootstrap 模型的数据框或预测值列表。将其重塑为非常长的形式,为 geom_line
函数创建一个分组列。
foo_long <- data.frame(foo, drat) %>%
pivot_longer(cols=-drat, names_to="Model", values_to="mpg")
ggplot(data = mtcars, aes(x = drat, y = mpg)) +
geom_point(color='blue') +
geom_line(data = foo_long, aes(x=drat, y=mpg, group=Model, color=Model)) +
guides(color=FALSE)
从引导模型中,我有 1000 组回归模型的系数:
y = b0 + b1x + b2(x^2)
如果我已经有了系数,绘制二次线的函数调用是什么? I.E.我不想 "fit" 对我的数据使用线性模型。
我尝试通过 for 循环向我的 ggplot 对象添加行:
for (i in 1:1000) {
reg_line <- stat_function(fun=function(x) quad$coefficients[1] +
quad$coefficients[i,2]*x + quad$coefficients[i,3]*(x**2))
reg_lines <- reg_lines + reg_line}
那没用 - 它似乎只在循环中添加了最后一行。
我想在我的图中添加 1000 条回归线的原因是因为这是一个家庭作业问题 - 我很清楚这不是一个常见的用例。
可能还有其他方法可以做到这一点,但希望这能给你一些想法。我使用了 mtcars 数据集并生成了一些 bootstrap 样本用于建模。您可以跳过这一步。
library(ggplot2)
library(tidyr)
library(dplyr)
data(mtcars)
drat=seq(min(mtcars$drat), max(mtcars$drat), length.out=100)
# Bootstrap function
bs <- function() {
df = mtcars[sample(1:nrow(mtcars), replace=TRUE),]
lm_fit <- lm(mpg ~ drat+I(drat^2), data=df)
data.frame(Model=predict(lm_fit, newdata=data.frame(drat))) # Replace with your own
}
foo <- replicate(10, bs()) # Simulate
您将从这里开始,因为您应该已经拥有来自 1,000 个 bootstrap 模型的数据框或预测值列表。将其重塑为非常长的形式,为 geom_line
函数创建一个分组列。
foo_long <- data.frame(foo, drat) %>%
pivot_longer(cols=-drat, names_to="Model", values_to="mpg")
ggplot(data = mtcars, aes(x = drat, y = mpg)) +
geom_point(color='blue') +
geom_line(data = foo_long, aes(x=drat, y=mpg, group=Model, color=Model)) +
guides(color=FALSE)