SPSS：如何根据每个 ID 的第一个日期的顺序从包含重复 ID 的客户端 ID 变量生成 ID 号

Question

之前，我问过如何从包含重复 ID 的客户端 ID 变量生成 ID 号。我将在这个问题中使用相同的示例数据，但我想知道如何按照每个 ID 的第一个日期的顺序生成 ID 号。我的客户端 ID 变量是字符串，必须保留为字符串。

我的数据如下：

ClientID TimeStamp

15137.45692 15/03/2021

10489.15789 03/02/2021

14143.96745 01/01/2021

15137.45692 15/01/2021

15137.45692 27/02/2021

14143.96745 08/03/2021

我希望它看起来像：

ID ClientID TimeStamp

1 14143.96745 01/01/2021

1 14143.96745 08/03/2021
    
2 15137.45692 15/01/2021

2 15137.45692 27/02/2021

2 15137.45692 15/03/2021
    
3 10489.15789 03/02/2021

我之前试过的代码是这样的：

sort cases by ClientID.
compute ID=1.
if $casenum>1 ID=lag(ID)+(ClientID<>lag(ClientID)).
exe.

然而，虽然它为我提供了每个 ID 的 ID 号，但这些 ID 号并未按 TimeStamp 排序。

Answer 1

为了创建新 ID，需要按 ClientID 对数据进行排序。但是新 ID 将具有与 ClientID 相同的顺序，而您想要的顺序不是按 ClientID 而是按出现的第一个日期。所以首先我们需要计算每个 ClientID 的第一个日期，然后我们可以在创建新 ID 之前使用它进行排序。注意：您需要确保将 TimeStamp 定义为日期变量。

aggregate outfile=* mode=addvariables /break=ClientID /firstDate=min(TimeStamp).
sort cases by firstDate ClientID.
compute ID=1.
if $casenum>1 ID=lag(ID)+(ClientID<>lag(ClientID)).
exe.

SPSS：如何根据每个 ID 的第一个日期的顺序从包含重复 ID 的客户端 ID 变量生成 ID 号

SPSS: How do I generate ID numbers from client ID variable that contains duplicate IDs in the order of the first date of each ID

spss

duplicates

longitudinal