为什么 bootstrap returns 为空,标准偏差和 CI 等值缺失
why bootstrap returns empty and values for standard deviation and CI and others are missing
我正在尝试使用 Stata bootstrap
命令来估计来自 nlsw88 数据集的 hours
变量的中位数的 sd。
我无法得到答案,但是当我将代码中的变量从 hours
更改为 wage
时,它起作用了。这两个变量之间的唯一区别是 hours
是整数,而 wage
是小数。我什至将 hours
的存储类型从 byte
更改为 float
但没有任何改变。
sysuse nlsw88
bootstrap r(p50), nodots: summarize hours , detail
您 bootstrapping 估计中位数 (p50
),但实际上中位数没有变化。
不确定 bootstrap
的具体工作原理,但您没有设置样本大小,48.75% 的观察值的值为 40,也接近平均值。所有这些使得很可能所有样本的中位数都是 40,因此样本之间没有差异。
您必须选择一个非常小的样本量,这样随机抽取的样本之间的中位数才有可能出现任何差异。例如,如果您每 bootstrap 轮只抽取 5 个观察值。
sysuse nlsw88
bootstrap r(p50) , size(5) nodots: summarize hours , detail
这可能解释了为什么您会得到缺失值(这是您的问题),但它并没有回答您应该怎么做。问问自己是否真的打算使用中位数?或者如果 bootstrap 是在这里使用的正确方法?
我正在尝试使用 Stata bootstrap
命令来估计来自 nlsw88 数据集的 hours
变量的中位数的 sd。
我无法得到答案,但是当我将代码中的变量从 hours
更改为 wage
时,它起作用了。这两个变量之间的唯一区别是 hours
是整数,而 wage
是小数。我什至将 hours
的存储类型从 byte
更改为 float
但没有任何改变。
sysuse nlsw88
bootstrap r(p50), nodots: summarize hours , detail
您 bootstrapping 估计中位数 (p50
),但实际上中位数没有变化。
不确定 bootstrap
的具体工作原理,但您没有设置样本大小,48.75% 的观察值的值为 40,也接近平均值。所有这些使得很可能所有样本的中位数都是 40,因此样本之间没有差异。
您必须选择一个非常小的样本量,这样随机抽取的样本之间的中位数才有可能出现任何差异。例如,如果您每 bootstrap 轮只抽取 5 个观察值。
sysuse nlsw88
bootstrap r(p50) , size(5) nodots: summarize hours , detail
这可能解释了为什么您会得到缺失值(这是您的问题),但它并没有回答您应该怎么做。问问自己是否真的打算使用中位数?或者如果 bootstrap 是在这里使用的正确方法?