在不删除 *SAS* 的情况下计算变量中的重复观察值

Counting duplicate observations in a variable without deleting *SAS*

我有一个年度患者索赔的数据集,其中每个患者可以代表不止一次,因为他每年可以有不止一次的索赔(即:如果一个女人在一次生育两次,她可以有两次索赔年)。

我想统计每个患者ID重复的次数,但又不想剔除重复项或将其从数据集中取出。是否有不同的代码来执行此操作?

谢谢!!

data work.claims_data;
input patient_id $ claim_number $;
datalines;
P1 C1
P1 C2
P1 C3
;
run;

proc sql;
select patient_id,count(distinct claim_number) - 1 as cnt
from claims_data
group by patient_id
having cnt > 0;
quit;

工作:SQL 上面的过程将对来自输入数据集的不同索赔编号进行患者明智的计数。如果我们从每个计数中减去 1,将为每个患者提供重复索赔计数。

输出:

Patient_ID    cnt
        P1      2