R:加速 data.table 中 3900 万行和两列的组合(粘贴或粘贴 0)操作
R: Speed up combine(paste or paste0) operation for 39 millions rows and two columns in data.table
我有一个 DT (data.table),其中包括 3900 万行和两列,例如 cola
和 colb
,我想添加一个名为colc
,也就是DT[,
:=(colc = paste(cola, colb, sep="-"))
,但是速度有点慢
你有加速这个操作的替代方法吗?
按照@Frank的建议,使用by = 'cola,colb'
,我原来的问题可以用这种方式解决,不需要添加额外的列。
我有一个 DT (data.table),其中包括 3900 万行和两列,例如 cola
和 colb
,我想添加一个名为colc
,也就是DT[,
:=(colc = paste(cola, colb, sep="-"))
,但是速度有点慢
你有加速这个操作的替代方法吗?
按照@Frank的建议,使用by = 'cola,colb'
,我原来的问题可以用这种方式解决,不需要添加额外的列。