在 R 中测试置信区间
Testing confidence intervals in R
我目前构建了一个 95% 的置信区间,然后使用 replicate()
随机生成 1000 个置信区间。我想测量有多少间隔包含我的平均值。我知道理论上应该有 950 个,但我如何获得明确的答案?下面列出了我使用的函数和平均值。
z <- function(a,b,c){
error <- rnorm(a, b, c) * c / sqrt(a)
left <- b - error
right <- j + error
paste("[",round(left,2),";",round(right,2),"]")
}
set.seed(123)
replicate(1000, z(10,1,1))
我从这里去哪里?
也许这就是您想要做的?
这 z()
将 return 正态分布总体均值的置信区间。
z <- function(N, mu, std, cl=95) {
alpha <- (1-cl/100)/2
# CI for population mean
sep <- std/sqrt(N)
z_s <- qnorm(1 - alpha)
pop_lower <- mu - z_s*sep
pop_upper <- mu + z_s*sep
c(lower=pop_lower, upper=pop_upper)
}
意味着如果我产生一个随机变量 mean(rnorm(20, 0, 1))
,那么我们期望它的值落在 z(20, 0, 1, 95)
内,概率为 0.95。
为了测试这个我们可以做
# specify parameters
N <- 20
mu <- 0
std <- 1
# produce a good number (10,000) of population means
set.seed(1)
r <- replicate(1e4, mean(rnorm(N, mu, std)))
# calculate confidence interval
ci <- z(N, mu, std)
# find which are below, within and above the interval
rc <- cut(r, c(min(r), ci, max(r)), c("below", "within", "above"))
# create a proportion table
round(prop.table(table(rc))*100, 2)
# below within above
# 2.59 95.08 2.33
我目前构建了一个 95% 的置信区间,然后使用 replicate()
随机生成 1000 个置信区间。我想测量有多少间隔包含我的平均值。我知道理论上应该有 950 个,但我如何获得明确的答案?下面列出了我使用的函数和平均值。
z <- function(a,b,c){
error <- rnorm(a, b, c) * c / sqrt(a)
left <- b - error
right <- j + error
paste("[",round(left,2),";",round(right,2),"]")
}
set.seed(123)
replicate(1000, z(10,1,1))
我从这里去哪里?
也许这就是您想要做的?
这 z()
将 return 正态分布总体均值的置信区间。
z <- function(N, mu, std, cl=95) {
alpha <- (1-cl/100)/2
# CI for population mean
sep <- std/sqrt(N)
z_s <- qnorm(1 - alpha)
pop_lower <- mu - z_s*sep
pop_upper <- mu + z_s*sep
c(lower=pop_lower, upper=pop_upper)
}
意味着如果我产生一个随机变量 mean(rnorm(20, 0, 1))
,那么我们期望它的值落在 z(20, 0, 1, 95)
内,概率为 0.95。
为了测试这个我们可以做
# specify parameters
N <- 20
mu <- 0
std <- 1
# produce a good number (10,000) of population means
set.seed(1)
r <- replicate(1e4, mean(rnorm(N, mu, std)))
# calculate confidence interval
ci <- z(N, mu, std)
# find which are below, within and above the interval
rc <- cut(r, c(min(r), ci, max(r)), c("below", "within", "above"))
# create a proportion table
round(prop.table(table(rc))*100, 2)
# below within above
# 2.59 95.08 2.33