重塑一个包含标称数据的数据框,其中值成为列前缀
Reshape a dataframe continaing nominal data where value becomes column prefix
问候同事们,我正在努力解决一个基本问题,但似乎无法解决我的问题。我的数据集结构如下:
Reference | Person | DOB |Status | Address
------------------------------------------------------
0001/xy | 001 |19/01/1960 | Respondent |123 Fake Street
0001/xy | 002 |01/06/1978 | Defendant |555 High Ave.
0002/xy | 001 |31/04/1988 | Respondent |432 Random Dr.
0002/xy | 002 |14/07/1991 | Defendant |666 Missing Close
0002/xy | 003 |10/10/2010 | Defendant |987 McFakerton Blvd.
0003/xy | 001 |08/02/1995 | Respondent |911 Crime Street
Reference
是 "incident" 的唯一键我需要的是单行宽数据集,其中要旋转的列是 Status
和新列包含列值的前缀。所以它应该看起来像;
Reference | Person | Respondent1_DOB | Respondent1_Address |Defendent1_DOB | Defendent1_Address |Defendent2_DOB | Defendent2_Address
-------------------------------------------------------------------------------------------------------------------------------------
0001/xy | 001 |19/01/1960 |123 Fake Street |01/06/1978 |555 High Ave | |
0002/xy | 001 |31/04/1988 |432 Random Dr. |14/07/1991 |666 Missing Close |10/10/2010 |987 McFakerton Blvd
0003/xy | 001 |08/02/1995 |911 Crime Street | | | |
如你所见这是一个简单的任务,但是我尝试过的所有重塑函数,包括tidyr
和Reshape2
继续尝试总结去除标称特征的数据,此外不为提供的值复制列 headers,或者完全失败。
我目前尝试过但失败的代码包括:
Trans<-transform(reshape(Original, direction='wide',
varying=list(3,5))[-1], id=Status)
Trans<- dcast(Original, Reference ~ Status,
value.var = c("DOB","Address"))
Trans<- Original %>% pivot_wide(Reference ~ Status,names_preifx=Status )
在 R 中有没有一种简单的方法可以做到这一点?我可以在 Python 中做到这一点,但我试图坚持使用一种语言 IDE,因为这是组织目前所拥有的。
你可以使用 base r reshape
函数:
reshape(df[-4],timevar = "Person",idvar = "Reference",direction = "wide")
Reference DOB.001 Address.001 DOB.002 Address.002 DOB.003 Address.003
1 0001/xy 19/01/1960 123 Fake Street 01/06/1978 555 High Ave. <NA> <NA>
3 0002/xy 31/04/1988 432 Random Dr. 14/07/1991 666 Missing Close 10/10/2010 987 McFakerton Blvd.
6 0003/xy 08/02/1995 911 Crime Street <NA> <NA> <NA> <NA>