如何在不放回的情况下进行比例分层抽样?

How to do proportionate stratified sampling without replacement?

我想 select 我在 Stata 13 中的样本基于三个层变量,总共 12 个层(大小 - 两个层;部门 - 三层;无形强度 - 两个层)。 select离子应该是成比例的,没有置换。

但是,我只能找到不成比例的 selection 命令,例如 select 每个层的 x%。

谁能帮我解决这个问题?

问题是,地层可能 "overlap"。所以你可能必须在初稿后重新平衡样本。

现在的问题是,如何实现。最终样本应尽可能代表总体的比例。

感谢您的讨论。我想我知道我的问题出在哪里了。

命令"gsample"可以根据不同的变量select分层。因此,我认为我必须定义三个不同的层变量。不过解决方法应该更简单。

总共有 12 个层(部门 1 中强度高的大公司,部门 1 中强度高的小公司,依此类推)样本中的每个公司都属于其中一个层。

我所要做的就是创建一个变量 "strataident",其值从 1 到 12 来标识不同的层。我对人口数据集执行此操作,因此落入每个阶层的公司数量代表人口。以下代码将为我提供一个代表总体的分层随机样本。

gsample 10, percent strata (strataident) wor

此命令同样有效并且更容易,请参阅 1 中的示例:

gsample 10, percent wor strata(size sector intensity)