在 SPSS 中创建和使用多个数据集

Creating and using multiple datasets in SPSS

请原谅这个可能很幼稚的问题,但尽管我有数据库方面的经验,但我还是 SPSS 的新手,可能忽略了一些简单的事情。

我有关于患者的数据(唯一标识符、年龄、性别等)

患者接受多种不同类型的测试,每个测试可能需要几百到几千个字段(unique-pt-identifier、testtype、testdate、testdata1、testdata2、... testdata2000)。我有这些测试结果的大量数据集。

我想计算有关测试结果的内容,但这些计算有时需要参考患者的属性。我知道我可以向测试数据集添加列,将患者数据添加到每一行,但这看起来很尴尬和多余(患者多次接受相同类型的测试,所以我最终会多次添加相同的信息)。

这在概念上似乎很简单,但除非我只是使用了错误的术语,否则我在 SPSS 命令语法或多个网络搜索中都找不到任何相关信息。如果指向它,很高兴阅读正确的文档。

非常感谢。

在 SPSS 中,您需要将要交互的所有数据都放在同一个数据集中。所以是的 - 你必须在同一个数据集中获得患者的属性和测试结果。如果这导致数据集(太大),有两种简单的方法可以用较小的数据集获得所需的内容: 首先,您不必将所有测试结果和所有患者属性放在一起——只需将与每个分析相关的那些放在一起。例如:

match files /file=testresults /table=patients /by=patientID 
    /keep=patientID test1 test2 property1 property2.
exe.
dataset name dataForAnalysis1.

第二种方法是首先将测试数据聚合到患者级别,然后才匹配数据集。

dataset activete testdata.
dataset declare agg1.
aggregate out=agg1 /break patientID /test1 test2=mean(test1 test2).
match files /file=agg1 /table=patients /by patientID.
exe.
dataset name dataForAnalysis1.