按 ID 对观察结果进行分组，同时创建特征变量

Question

我正在进行一项针对厄瓜多尔个人的调查，我想分析每个家庭的特征。每个人都有一个 houseID，所以我想我需要使用该变量对他们进行分组，同时还创建一些关于他们特征的额外变量：例如，如果家庭有两名或更多女性，则虚拟值为 1。下面我将 post 举个例子。

我会知道如何在 R 中执行此操作 (group_by)，但我在 Stata 中没有找到类似的命令。

我的数据的简化版本是：

houseID         femaleDummy   maleDummy
10000000001     1             0
10000000001     1             0
10000000001     0             1
10000000002     0             1
10000000002     0             1

我想得到类似的东西

houseID         twoFemalesormoreDummy
10000000001     1
10000000002     0

Answer 1

很简单我的朋友

gen d_female = femaleDummy == 1   
bysort houseID: egen total_female = total(d_female)
bysort houseID: gen dummy = total_female >= 2

按 ID 对观察结果进行分组，同时创建特征变量

Grouping observations by ID while also creating characteristic variables

survey

stata

dummy-variable