纵向数据集分类变量

longitudinal dataset categorical variables

我有一个纵向数据集,其中包含来自 2 月和 6 月的 2 波个体的变量,这些变量衡量这些个体的经济 activity。 2 月和 5 月波浪的变量是分类变量,我在 Stata 中 运行 宁 proportion 命令以获得经济 activity 的个体变化。例如。我正在寻找跨 2 个波浪的工作时间变化,我 运行 proportion 但无法弄清楚 if 条件,因为我只想要在 2 月和 6 月都做出回应的个人。我想删除所有在 2 月而不是 5 月或类似时间回复的人。

假设您有一个标识符变量 id 和一个取值 1 和 2 的类时间变量 wave。如果是这样,您正在寻找满足

bysort id (wave) : gen wanted = wave[1] == 1 & wave[2] == 2 

所以 wanted 是一个指标,对于两个波浪中存在的个人为 1,否则为 0,if wanted 将是 select 那些想要的人的 if 条件.

这有很多变体,具体取决于:您的变量名;您的数据布局;如何保存有关波浪的信息(也可以是包含 "Feb""May""June" 等值的字符串变量,或保存日期的数字变量)。

您对问题进行了粗略的描述,但几乎没有关于数据的精确信息。 stata 标签 wiki 提供了关于如何 post 问题的详细建议,并标明了给出具体数据示例的重要性。