Error: `labels` must be unique for SPSS to R conversion

Error: `labels` must be unique for SPSS to R conversion

我下载了以下文件(DS43 Election Returns for New York,1885-1906): https://www.icpsr.umich.edu/web/ICPSR/studies/1/datadocumentation#

我试过用R打开它:

data <- "00001-0042-Data.txt"

data_setup <- "00001-0042-Setup.sps"
data <- asciiSetupReader::read_ascii_setup(
  data = data,
  setup_file = data_setup)

但我在 R 中收到以下错误:

Error: `labels` must be unique

我尝试查看 SPS 文件中的“变量标签”列表,方法是将其粘贴到 Excel,用 space 分隔,并以此方式识别重复项。到目前为止,我能够识别出五个重复项:

我将 1 放在变量的第二个实例旁边(稍后当我可以检查变量实际上相同时我会删除它)但我仍然收到“错误:labels 必须是唯一的" 错误。

是否有更有效的方法来检查重复标签,还是我忽略了什么?

我不确定您的 ID 列名称是什么,但是 data %>% group_by(id_name) %>% summarise(count = n) %>% arrange(count) 之类的内容应该将所有重复项放在顶部,以便您可以看到它们。例如,如果您想查看 mpg 的哪些值在 mtcars 中出现不止一次,您可以 运行:

mtcars %>% 
  group_by(mpg) %>% 
  summarise(count = n()) %>% 
  arrange(-count)