通过自举的置信区间
Confidence intervals via bootstrapping
昨天我开始阅读有关在许多情况下使用引导程序来确定置信区间 (CIs) 的内容。我目前的情况是,我正在尝试通过最大似然估计 (MLE) 来估计模型中的三个参数。我已经完成了,现在我需要定义我的 CIs。这显然可以通过配置文件可能性来完成,但据我所知,自举将提供更广泛的 CI 间隔。我的问题是我不确定如何实际执行引导程序?我已经为参数估计编写了自己的代码,因此没有内置 MLE 计算器。
基本上,我所观察到的数据是二进制数据,因此是 1 或 0。我试图根据这些数据(放入具有三个参数的模型)来估计参数值。
所以假设我的群组是 500,那么我的想法是从我的群组中抽取样本,也许是 100,然后通过将样本乘以 5 次将其再次扩展到 500,运行再次模拟,这反过来应该会产生一些新的参数估计,然后只需执行 1000-2000 次即可获得一系列参数值,然后可用于定义 CI ?
还是我遗漏了什么?
此问题与 Python 无关。我认为您需要阅读引导程序简介。 "An Introduciton to Statistical Learning"提供了一个很好的。这个想法不是抽样 100——您必须抽样 替换 并采用 相同的样本大小 (500)。是的,然后你多次重新估计你的参数。然后有几种方法可以将所有这些估计值转化为置信区间。例如,您可以使用它们来估计标准误差(抽样分布的标准偏差),然后使用 +/- 2*se.
昨天我开始阅读有关在许多情况下使用引导程序来确定置信区间 (CIs) 的内容。我目前的情况是,我正在尝试通过最大似然估计 (MLE) 来估计模型中的三个参数。我已经完成了,现在我需要定义我的 CIs。这显然可以通过配置文件可能性来完成,但据我所知,自举将提供更广泛的 CI 间隔。我的问题是我不确定如何实际执行引导程序?我已经为参数估计编写了自己的代码,因此没有内置 MLE 计算器。
基本上,我所观察到的数据是二进制数据,因此是 1 或 0。我试图根据这些数据(放入具有三个参数的模型)来估计参数值。
所以假设我的群组是 500,那么我的想法是从我的群组中抽取样本,也许是 100,然后通过将样本乘以 5 次将其再次扩展到 500,运行再次模拟,这反过来应该会产生一些新的参数估计,然后只需执行 1000-2000 次即可获得一系列参数值,然后可用于定义 CI ?
还是我遗漏了什么?
此问题与 Python 无关。我认为您需要阅读引导程序简介。 "An Introduciton to Statistical Learning"提供了一个很好的。这个想法不是抽样 100——您必须抽样 替换 并采用 相同的样本大小 (500)。是的,然后你多次重新估计你的参数。然后有几种方法可以将所有这些估计值转化为置信区间。例如,您可以使用它们来估计标准误差(抽样分布的标准偏差),然后使用 +/- 2*se.