用 for 循环逐列填充数据

Fill data frame by column with for loop

我创建了一个包含 11 列和 15 行的空数据框,随后为这些列命名。

L_df <- data.frame(matrix(ncol = 11, nrow = 15))
names(L_df) <- paste0("L_por", 0:10)

w <- c(0.2, 0.4, 0.6, 0.8, 1, 1.2, 1.4, 1.6, 1.8, 2, 2.2, 2.4, 2.6,  2.8, 3)
wu <- 0
L <- 333.7
pm <- c(2600, 2574, 2548, 2522, 2496, 2470, 2444, 2418, 2392, 2366,  2340)

数据框如下所示:

head(L_df)
  L_por0 L_por1 L_por2 L_por3 L_por4 L_por5 L_por6 L_por7 L_por8 L_por9 L_por10
1     NA     NA     NA     NA     NA     NA     NA     NA     NA     NA      NA
2     NA     NA     NA     NA     NA     NA     NA     NA     NA     NA      NA
3     NA     NA     NA     NA     NA     NA     NA     NA     NA     NA      NA
4     NA     NA     NA     NA     NA     NA     NA     NA     NA     NA      NA
5     NA     NA     NA     NA     NA     NA     NA     NA     NA     NA      NA
6     NA     NA     NA     NA     NA     NA     NA     NA     NA     NA      NA

现在,我想根据公式按列填充数据框。我试图用嵌套的 for 循环来表达这一点:

 for (i in 1:ncol(L_df)) {
  pm_tmp <- pm[i]
  col_tmp <- colnames(L_df)[i]
  for (j in 1:nrow(L_df)) {
    w_tmp <- w[j]
    L_por_tmp <- pm_tmp*L*((w_tmp-wu)/100)
    col_tmp[j] <- L_por_tmp
  }
}

对于每个 ,我迭代一个长度为 11 的预定义向量 pm。对于每个 ,我迭代在长度为 15 的预定义向量 w 上(重复每一列)。

示例:首先,第一列为 select pm[1]。其次,第一列中的每一行 select w[i]。将公式存储在 L_por_tmp 中,并用它来填充第 1 行到第 15 行的第一列。整个过程应该为第二列(pm[2])重新开始,每一行为 w[i],依此类推。 wuL固定在公式中。

R 执行代码没有错误。当我检查 tmp 值时,它们是正确的。但是,数据框仍然是空的。 L_df 没有填满。我想用循环解决这个问题,但如果您有其他解决方案,我很高兴听到它们!我得到的印象可能是一种更顺畅的方式来做到这一点。干杯!

解决方案

L_df <- data.frame(sapply(pm, function(x) x * L * ((w - wu) / 100)))
names(L_df) <- c("L_por0", "L_por1", "L_por2", "L_por3", "L_por4", "L_por5",
                 "L_por6", "L_por7", "L_por8", "L_por9", "L_por10")
L_df
 L_por0    L_por1    L_por2    L_por3    L_por4    L_por5    L_por6    L_por7
1   1735.24  1717.888  1700.535  1683.183  1665.830  1648.478  1631.126  1613.773
2   3470.48  3435.775  3401.070  3366.366  3331.661  3296.956  3262.251  3227.546
3   5205.72  5153.663  5101.606  5049.548  4997.491  4945.434  4893.377  4841.320
4   6940.96  6871.550  6802.141  6732.731  6663.322  6593.912  6524.502  6455.093
5   8676.20  8589.438  8502.676  8415.914  8329.152  8242.390  8155.628  8068.866
6  10411.44 10307.326 10203.211 10099.097  9994.982  9890.868  9786.754  9682.639
7  12146.68 12025.213 11903.746 11782.280 11660.813 11539.346 11417.879 11296.412
8  13881.92 13743.101 13604.282 13465.462 13326.643 13187.824 13049.005 12910.186
9  15617.16 15460.988 15304.817 15148.645 14992.474 14836.302 14680.130 14523.959
10 17352.40 17178.876 17005.352 16831.828 16658.304 16484.780 16311.256 16137.732
11 19087.64 18896.764 18705.887 18515.011 18324.134 18133.258 17942.382 17751.505
12 20822.88 20614.651 20406.422 20198.194 19989.965 19781.736 19573.507 19365.278
13 22558.12 22332.539 22106.958 21881.376 21655.795 21430.214 21204.633 20979.052
14 24293.36 24050.426 23807.493 23564.559 23321.626 23078.692 22835.758 22592.825
15 26028.60 25768.314 25508.028 25247.742 24987.456 24727.170 24466.884 24206.598
      L_por8    L_por9   L_por10
1   1596.421  1579.068  1561.716
2   3192.842  3158.137  3123.432
3   4789.262  4737.205  4685.148
4   6385.683  6316.274  6246.864
5   7982.104  7895.342  7808.580
6   9578.525  9474.410  9370.296
7  11174.946 11053.479 10932.012
8  12771.366 12632.547 12493.728
9  14367.787 14211.616 14055.444
10 15964.208 15790.684 15617.160
11 17560.629 17369.752 17178.876
12 19157.050 18948.821 18740.592
13 20753.470 20527.889 20302.308
14 22349.891 22106.958 21864.024
15 23946.312 23686.026 23425.740

说明

sapply() 函数可用于以更符合 R 编程习惯的方式迭代向量。我们迭代 pm 并使用你的公式 once 因为 R 是 vectorised;每次它创建一个长度为 15 的向量(所以 11 个长度为 15 的向量),当我们将它包装在 data.frame() returns 所需的数据框中并添加列名时。

注意:使用 apply() 族函数将函数应用于向量的每个元素与使用 for 循环进行迭代具有一些不同的含义。在你的情况下,我认为 sapply() 更容易理解。有关何时需要循环或何时应用之类的东西更好的更多信息,请参阅 Hadley Wickham 的 Advanced R 书中的示例 this discussion

你只是犯了一个小错误,你已经差不多了,编辑了你的函数:

for (i in 1:ncol(L_df)) {
  pm_tmp <- pm[i]
  col_tmp <- colnames(L_df)[i]
  for (j in 1:nrow(L_df)) {
    w_tmp <- w[j]
    L_por_tmp <- pm_tmp*L*((w_tmp-wu)/100)
    L_df[ j ,col_tmp] <- L_por_tmp ##You must have used df[i, j] referencing here
  }
}

输出:

只打印几行的头部:

L_df
     L_por0    L_por1    L_por2    L_por3    L_por4    L_por5    L_por6    L_por7    L_por8    L_por9   L_por10
1   1735.24  1717.888  1700.535  1683.183  1665.830  1648.478  1631.126  1613.773  1596.421  1579.068  1561.716
2   3470.48  3435.775  3401.070  3366.366  3331.661  3296.956  3262.251  3227.546  3192.842  3158.137  3123.432
3   5205.72  5153.663  5101.606  5049.548  4997.491  4945.434  4893.377  4841.320  4789.262  4737.205  4685.148