如何创建双重循环?
How to create doubled a loop?
下面的代码运行得很好,但是:我每次 运行 代码之前都必须更改样本大小 n = 25、50 ... 和方差估计器。
我想用一个循环来解决这个问题。
下面简单介绍一下代码。在代码中,针对给定样本量 n 创建了 1000 个回归模型。然后,1000 个回归模型中的每个回归模型都由 OLS 进行估计。之后,我根据 1000 个样本中 x3 的不同 beta 值计算 t 统计量。零假设为:H0: beta03 = beta3,即 x3 的计算 beta 值等于我定义为 1 的 'real' 值。在最后一步中,我检查零假设被拒绝的频率(显着性水平 = 0.05 ).
我的最终目标是创建一个代码,为每个样本大小和方差估计量吐出原假设的概率拒绝率。如果你们中的任何人能帮助我,我会很高兴。在这里你可以看到我的代码:
#sample size n = 25, 50, 100, 250, 500, 1000
n <- 50
B <- 1000
#'real' beta values
beta0 <- 1
beta1 <- 1
beta2 <- 1
beta3 <- 1
t.test.values <- rep(NA, B)
#simulation of size
for(rep in 1:B){
#data generation
d1 <- runif(n, 0, 1)
d2 <- rnorm(n, 0, 1)
d3 <- rchisq(n, 1, ncp=0)
x1 <- (1 + d1)
x2 <- (3*d1 + 0.6*d2)
x3 <- (2*d1 + 0.6*d3)
exi <- rchisq(n, 4, ncp = 0)
y <- beta0 + beta1*x1 + beta2*x2 + beta3*x3 + exi
mydata <- data.frame(y, x1, x2, x3)
#ols estimation
lmobj <- lm(y ~ x1 + x2 + x3, mydata)
#extraction
betaestim <- coef(lmobj)[4]
betavar <- vcov(lmobj)[4,4]
#robust variance estimators: hc0, hc1, hc2, hc3
betavar0 <- hccm(lmobj, type="hc0")[4,4]
betavar1 <- hccm(lmobj, type="hc1")[4,4]
betavar2 <- hccm(lmobj, type="hc2")[4,4]
betavar3 <- hccm(lmobj, type="hc3")[4,4]
#t statistic
t.test.values[rep] <- (betaestim - beta3h0)/sqrt(betavar)
}
alpha <- 0.05
test.decision <- abs(t.test.values) < qt(p=c(1-alpha/2), df=n-4)
length(test.decision[test.decision==FALSE])/B
编写运行模拟的函数
library(car)
sample_size = c("n=25"=25, "n=50"=50, "n=100"=100, "n=250"=250, "n=500"=500, "n=1000"=1000)
B <- 100
beta0 <- 1
beta1 <- 1
beta2 <- 1
beta3 <- 1
alpha <- 0.05
sim <- function(n, beta3h0){
t.test.values <- rep(NA, B)
#simulation of size
for(rep in 1:B){
#data generation
d1 <- runif(n, 0, 1)
d2 <- rnorm(n, 0, 1)
d3 <- rchisq(n, 1, ncp=0)
x1 <- (1 + d1)
x2 <- (3*d1 + 0.6*d2)
x3 <- (2*d1 + 0.6*d3)
exi <- rchisq(n, 4, ncp = 0)
y <- beta0 + beta1*x1 + beta2*x2 + beta3*x3 + exi
mydata <- data.frame(y, x1, x2, x3)
#ols estimation
lmobj <- lm(y ~ x1 + x2 + x3, mydata)
#extraction
betaestim <- coef(lmobj)[4]
betavar <- vcov(lmobj)[4,4]
#robust variance estimators: hc0, hc1, hc2, hc3
betavar0 <- hccm(lmobj, type="hc0")[4,4]
betavar1 <- hccm(lmobj, type="hc1")[4,4]
betavar2 <- hccm(lmobj, type="hc2")[4,4]
betavar3 <- hccm(lmobj, type="hc3")[4,4]
#t statistic
t.test.values[rep] <- (betaestim - beta3h0)/sqrt(betavar)
}
mean(abs(t.test.values) < qt(p=c(1-alpha/2), df=n-4))
}
并使用lapply
sapply(sample_size, sim, beta3h0 = 0.7)
# n=25 n=50 n=100 n=250 n=500 n=1000
# 0.92 0.88 0.92 0.79 0.44 0.24
下面的代码运行得很好,但是:我每次 运行 代码之前都必须更改样本大小 n = 25、50 ... 和方差估计器。 我想用一个循环来解决这个问题。
下面简单介绍一下代码。在代码中,针对给定样本量 n 创建了 1000 个回归模型。然后,1000 个回归模型中的每个回归模型都由 OLS 进行估计。之后,我根据 1000 个样本中 x3 的不同 beta 值计算 t 统计量。零假设为:H0: beta03 = beta3,即 x3 的计算 beta 值等于我定义为 1 的 'real' 值。在最后一步中,我检查零假设被拒绝的频率(显着性水平 = 0.05 ). 我的最终目标是创建一个代码,为每个样本大小和方差估计量吐出原假设的概率拒绝率。如果你们中的任何人能帮助我,我会很高兴。在这里你可以看到我的代码:
#sample size n = 25, 50, 100, 250, 500, 1000
n <- 50
B <- 1000
#'real' beta values
beta0 <- 1
beta1 <- 1
beta2 <- 1
beta3 <- 1
t.test.values <- rep(NA, B)
#simulation of size
for(rep in 1:B){
#data generation
d1 <- runif(n, 0, 1)
d2 <- rnorm(n, 0, 1)
d3 <- rchisq(n, 1, ncp=0)
x1 <- (1 + d1)
x2 <- (3*d1 + 0.6*d2)
x3 <- (2*d1 + 0.6*d3)
exi <- rchisq(n, 4, ncp = 0)
y <- beta0 + beta1*x1 + beta2*x2 + beta3*x3 + exi
mydata <- data.frame(y, x1, x2, x3)
#ols estimation
lmobj <- lm(y ~ x1 + x2 + x3, mydata)
#extraction
betaestim <- coef(lmobj)[4]
betavar <- vcov(lmobj)[4,4]
#robust variance estimators: hc0, hc1, hc2, hc3
betavar0 <- hccm(lmobj, type="hc0")[4,4]
betavar1 <- hccm(lmobj, type="hc1")[4,4]
betavar2 <- hccm(lmobj, type="hc2")[4,4]
betavar3 <- hccm(lmobj, type="hc3")[4,4]
#t statistic
t.test.values[rep] <- (betaestim - beta3h0)/sqrt(betavar)
}
alpha <- 0.05
test.decision <- abs(t.test.values) < qt(p=c(1-alpha/2), df=n-4)
length(test.decision[test.decision==FALSE])/B
编写运行模拟的函数
library(car)
sample_size = c("n=25"=25, "n=50"=50, "n=100"=100, "n=250"=250, "n=500"=500, "n=1000"=1000)
B <- 100
beta0 <- 1
beta1 <- 1
beta2 <- 1
beta3 <- 1
alpha <- 0.05
sim <- function(n, beta3h0){
t.test.values <- rep(NA, B)
#simulation of size
for(rep in 1:B){
#data generation
d1 <- runif(n, 0, 1)
d2 <- rnorm(n, 0, 1)
d3 <- rchisq(n, 1, ncp=0)
x1 <- (1 + d1)
x2 <- (3*d1 + 0.6*d2)
x3 <- (2*d1 + 0.6*d3)
exi <- rchisq(n, 4, ncp = 0)
y <- beta0 + beta1*x1 + beta2*x2 + beta3*x3 + exi
mydata <- data.frame(y, x1, x2, x3)
#ols estimation
lmobj <- lm(y ~ x1 + x2 + x3, mydata)
#extraction
betaestim <- coef(lmobj)[4]
betavar <- vcov(lmobj)[4,4]
#robust variance estimators: hc0, hc1, hc2, hc3
betavar0 <- hccm(lmobj, type="hc0")[4,4]
betavar1 <- hccm(lmobj, type="hc1")[4,4]
betavar2 <- hccm(lmobj, type="hc2")[4,4]
betavar3 <- hccm(lmobj, type="hc3")[4,4]
#t statistic
t.test.values[rep] <- (betaestim - beta3h0)/sqrt(betavar)
}
mean(abs(t.test.values) < qt(p=c(1-alpha/2), df=n-4))
}
并使用lapply
sapply(sample_size, sim, beta3h0 = 0.7)
# n=25 n=50 n=100 n=250 n=500 n=1000
# 0.92 0.88 0.92 0.79 0.44 0.24