变量的独立国家和年份元素

Separate country and year element of a variable

我正在尝试使用一个数据集,该数据集不方便地将国家和年份合并为国家变量。例如,对于 2006 年的美国,国家变量内的相应观测值将是 US2006。

有没有一种方法可以将两者分开并生成两个新变量,一个只包含国家名称,另一个只包含年份?

正如@Roberto Ferrer 评论的那样,如果字符串变量的值类似于 "US2006",您可以继续

 gen year = real(substr(whatever, -4, 4))
 gen country = substr(whatever, 1, length(whatever) - 4) 

第一个语句提取最后 4 个字符并将它们转换为数字。第二条语句从原始变量的副本中删除最后 4 个字符,并将其余字符放入新变量中。