按 ID 对观察结果进行分组,同时创建特征变量

Grouping observations by ID while also creating characteristic variables

我正在进行一项针对厄瓜多尔个人的调查,我想分析每个家庭的特征。每个人都有一个 houseID,所以我想我需要使用该变量对他们进行分组,同时还创建一些关于他们特征的额外变量:例如,如果家庭有两名或更多女性,则虚拟值为 1。下面我将 post 举个例子。

我会知道如何在 R 中执行此操作 (group_by),但我在 Stata 中没有找到类似的命令。

我的数据的简化版本是:

houseID         femaleDummy   maleDummy
10000000001     1             0
10000000001     1             0
10000000001     0             1
10000000002     0             1
10000000002     0             1

我想得到类似的东西

houseID         twoFemalesormoreDummy
10000000001     1
10000000002     0

很简单我的朋友

gen d_female = femaleDummy == 1   
bysort houseID: egen total_female = total(d_female)
bysort houseID: gen dummy = total_female >= 2