R:使用数据框中的字符条目索引行名和列名以从另一个数据框中提取元素
R: Using character entries in a data frame to index row names and column names to extract elements from another data frame
我想在我的数据框 transport_data
中使用两列来提取另一个数据框 CI_elec
中的相应值。 transport_data
中的 scenario
和 year
列给出了应该用于 select 来自 CI_elec
中的数据的行名和列名 CI_pkm
功能。
transport_data
的头部格式如下:
# A tibble: 6 x 9
scenario type year occupancy passenger.km vehicle.km TWh.vehicle.km
<chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl>
1 iea6 walk~ 2011 1 2.70e12 2.70e12 0
2 iea6 walk~ 2015 1 3.05e12 3.05e12 0
3 iea6 walk~ 2020 1 3.38e12 3.38e12 0
4 iea6 walk~ 2025 1 3.53e12 3.53e12 0
5 iea6 walk~ 2030 1 3.57e12 3.57e12 0
6 iea6 walk~ 2035 1 3.47e12 3.47e12 0
CI_elec
看起来像这样,其中 iea6 到 rcp2 是行名,2011 到 2050 是列名:
2011 2015 2020 2025 2030
iea6 0.0005787902 0.0005118950 0.0005047792 0.0005075581 0.0005060511
iea4 0.0005787902 0.0005118950 0.0004890350 0.0004754852 0.0004484639
iea2 0.0005787902 0.0005118095 0.0004521967 0.0003997270 0.0003085964
rcp8 0.0005787902 0.0005107324 0.0005350430 0.0005468413 0.0005447299
rcp6 0.0005787902 0.0005114301 0.0005086695 0.0005147240 0.0005129202
rcp2 0.0005787902 0.0005118596 0.0004671089 0.0004361393 0.0003887369
2035 2040 2045 2050
iea6 0.0004944316 0.0004812976 4.485943e-04 4.238010e-04
iea4 0.0004220578 0.0003909761 3.383678e-04 3.012483e-04
iea2 0.0002386181 0.0001679809 7.607596e-05 1.208776e-05
rcp8 0.0005370120 0.0005221591 4.914019e-04 4.727123e-04
rcp6 0.0004935201 0.0004928346 4.420779e-04 3.983801e-04
rcp2 0.0003437802 0.0003163802 2.963748e-04 2.790785e-04
函数CI_pkm
是:
for (i in 1:nrow(data)){
if (grepl('fuel|liquid', data[i, 2])) {
CI[i] <- (data[i, 7] * CI_fuels$liquid) / data[i, 4]
} else if (grepl('gas', data[i, 2])) {
CI[i] <- (data[i, 7] * CI_fuels$gas) / data[i, 4]
} else if (grepl('elec|EV', data[i, 2])) {
CI[i] <- (data[i, 7] * CI_elec[data[i, 1], data[i, 3]]) / data[i, 4]
}
}
as.numeric(CI)
}
CI_pkm
不会 运行 因为传递给 CI_elec
的值没有被引用,所以它们不能用于从 CI_elec
中提取数据。我想要做的是使用 transport_data
的 scenario
列(行名)和 year
列(行名)中保存的值从 CI_elec
中提取数据列名).
我的第一个想法是,我需要为 scenario
和 year
列中的值添加引号(可能使用 dQuote
或类似的);但是,我无法让它工作。我希望有人能为我提供一个好的解决方案。
如果将CI_elec
设为matrix
,可以使用行名和列名矩阵对其进行索引:
CI_elec_mat = as.matrix(CI_elec)
transport_data$new_column = CI_elec[cbind(transport_data$scenario, transport_data$year)]
我看到的另一个不错的解决方案是将 CI_elec
转换为长格式并使用连接将列添加到 CI
。
我想在我的数据框 transport_data
中使用两列来提取另一个数据框 CI_elec
中的相应值。 transport_data
中的 scenario
和 year
列给出了应该用于 select 来自 CI_elec
中的数据的行名和列名 CI_pkm
功能。
transport_data
的头部格式如下:
# A tibble: 6 x 9
scenario type year occupancy passenger.km vehicle.km TWh.vehicle.km
<chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl>
1 iea6 walk~ 2011 1 2.70e12 2.70e12 0
2 iea6 walk~ 2015 1 3.05e12 3.05e12 0
3 iea6 walk~ 2020 1 3.38e12 3.38e12 0
4 iea6 walk~ 2025 1 3.53e12 3.53e12 0
5 iea6 walk~ 2030 1 3.57e12 3.57e12 0
6 iea6 walk~ 2035 1 3.47e12 3.47e12 0
CI_elec
看起来像这样,其中 iea6 到 rcp2 是行名,2011 到 2050 是列名:
2011 2015 2020 2025 2030
iea6 0.0005787902 0.0005118950 0.0005047792 0.0005075581 0.0005060511
iea4 0.0005787902 0.0005118950 0.0004890350 0.0004754852 0.0004484639
iea2 0.0005787902 0.0005118095 0.0004521967 0.0003997270 0.0003085964
rcp8 0.0005787902 0.0005107324 0.0005350430 0.0005468413 0.0005447299
rcp6 0.0005787902 0.0005114301 0.0005086695 0.0005147240 0.0005129202
rcp2 0.0005787902 0.0005118596 0.0004671089 0.0004361393 0.0003887369
2035 2040 2045 2050
iea6 0.0004944316 0.0004812976 4.485943e-04 4.238010e-04
iea4 0.0004220578 0.0003909761 3.383678e-04 3.012483e-04
iea2 0.0002386181 0.0001679809 7.607596e-05 1.208776e-05
rcp8 0.0005370120 0.0005221591 4.914019e-04 4.727123e-04
rcp6 0.0004935201 0.0004928346 4.420779e-04 3.983801e-04
rcp2 0.0003437802 0.0003163802 2.963748e-04 2.790785e-04
函数CI_pkm
是:
for (i in 1:nrow(data)){
if (grepl('fuel|liquid', data[i, 2])) {
CI[i] <- (data[i, 7] * CI_fuels$liquid) / data[i, 4]
} else if (grepl('gas', data[i, 2])) {
CI[i] <- (data[i, 7] * CI_fuels$gas) / data[i, 4]
} else if (grepl('elec|EV', data[i, 2])) {
CI[i] <- (data[i, 7] * CI_elec[data[i, 1], data[i, 3]]) / data[i, 4]
}
}
as.numeric(CI)
}
CI_pkm
不会 运行 因为传递给 CI_elec
的值没有被引用,所以它们不能用于从 CI_elec
中提取数据。我想要做的是使用 transport_data
的 scenario
列(行名)和 year
列(行名)中保存的值从 CI_elec
中提取数据列名).
我的第一个想法是,我需要为 scenario
和 year
列中的值添加引号(可能使用 dQuote
或类似的);但是,我无法让它工作。我希望有人能为我提供一个好的解决方案。
如果将CI_elec
设为matrix
,可以使用行名和列名矩阵对其进行索引:
CI_elec_mat = as.matrix(CI_elec)
transport_data$new_column = CI_elec[cbind(transport_data$scenario, transport_data$year)]
我看到的另一个不错的解决方案是将 CI_elec
转换为长格式并使用连接将列添加到 CI
。