由多个变量子集?

Subset by multiple variables?

对于患者的专业索赔,我的数据集如下所示:

data professionalclaims;
input patient_ID ICN DOS Proc_code;
datalines
1 10 3nov2012 7686
1 11 3nov2012 6554
1 12 3nov2012 4543
2 13 13nov2012 5959
2 14 13nov2012 5454
3 15 18nov2012 5444
;
run;

其中 ICN 是个人索赔,DOS 是送达日期,proc_code 是完成的程序。

我想知道一个人在一次访问中有多少个人索赔,即一个人有多少个人 ICN 用于一个 DOS。

data professionalclaims;
input patient_ID ICN DOS date9. Proc_code;
datalines;
1 10 3nov2012 7686
1 11 3nov2012 6554
1 12 3nov2012 4543
2 13 13nov2012 5959
2 14 13nov2012 5454
3 15 18nov2012 5444
;
run;

proc sql;
     select patient_id, DOS format = date9., count(distinct ICN) as Ind_claim_Count
     from professionalclaims
     group by patient_id, DOS;
    quit;

工作:您将必须按 patient_id 和 DOS 分组,以计算一个人在每次访问时的个人索赔数。