高效的 data.table 方法在给定随机数的情况下生成额外的行

Question

我有一个很大的 data.table，我想生成一个随机数（使用两列）并执行计算。然后我想执行此步骤 1,000 次。我正在寻找一种无需循环即可高效执行此操作的方法。

示例数据：

> dt <- data.table(Group=c(rep("A",3),rep("B",3)), 
                   Year=rep(2020:2022,2), 
                   N=c(300,350,400,123,175,156),
                   Count=c(25,30,35,3,6,8), 
                   Pop=c(1234,1543,1754,2500,2600,2400))
> dt
   Group Year   N Count  Pop
1:     A 2020 300    25 1234
2:     A 2021 350    30 1543
3:     A 2022 400    35 1754
4:     B 2020 123     3 2500
5:     B 2021 175     6 2600
6:     B 2022 156     8 2400
> dt[, rate := rpois(.N, lambda=Count)/Pop*100000]
> dt[, value := N*(rate/100000)]
> dt
   Group Year   N Count  Pop      rate     value
1:     A 2020 300    25 1234 1944.8947 5.8346840
2:     A 2021 350    30 1543 2009.0732 7.0317563
3:     A 2022 400    35 1754 1938.4265 7.7537058
4:     B 2020 123     3 2500  120.0000 0.1476000
5:     B 2021 175     6 2600  115.3846 0.2019231
6:     B 2022 156     8 2400  416.6667 0.6500000

我希望能够对 value 进行 1,000 次此计算，并在不使用循环的情况下保留所有实例（具有 1-1,000 的指示器列，指示哪个运行）。有什么建议吗？

Answer 1

也许你可以像下面那样尝试replicate

n <- 1000
dt[, paste0(c("rate", "value"), rep(1:n, each = 2)) := replicate(n, list(u <- rpois(.N, lambda = Count) / Pop * 100000, N * (u / 100000)))]

高效的 data.table 方法在给定随机数的情况下生成额外的行

Efficient data.table method to generate additional rows given random numbers

random

simulation

r

data.table