计算数组求和的雅可比矩阵的简洁方法

Question

我正在 R 中做一些优化，因此我需要编写一个 returns 雅可比矩阵的函数。这是一个非常简单的雅可比矩阵——只有零和一个——但我想快速干净地填充它。我当前的代码可以工作，但是非常草率。

我有一个四维概率数组。按 i, j, k, l 索引维度。我的约束是，对于每个 i, j, k，索引 l 的概率总和必须等于 1.

我这样计算我的约束向量：

get_prob_array_from_vector <- function(prob_vector, array_dim) {
    return(array(prob_vector, array_dim))
}

constraint_function <- function(prob_vector, array_dim) {
    prob_array <- get_prob_array_from_vector(prob_vector, array_dim)
    prob_array_sums <- apply(prob_array, MARGIN=c(1, 2, 3), FUN=sum)
    return(as.vector(prob_array_sums) - 1)  # Should equal zero
}

我的问题是：什么是计算 as.vector(apply(array(my_input_vector, array_dim), MARGIN=c(1, 2, 3), FUN=sum)) 的 jacobian 的 干净、快速的方法——即上面代码中的 constraint_function -- 关于 my_input_vector?

这是我草率的解决方案（我检查了 numDeriv 包中的 jacobian 函数的正确性）：

library(numDeriv) array_dim <- c(5, 4, 3, 3) get_prob_array_from_vector <- function(prob_vector, array_dim) { return(array(prob_vector, array_dim)) } constraint_function <- function(prob_vector, array_dim) { prob_array <- get_prob_array_from_vector(prob_vector, array_dim) prob_array_sums <- apply(prob_array, MARGIN=c(1, 2, 3), FUN=sum) return(as.vector(prob_array_sums) - 1) } constraint_function_jacobian <- function(prob_vector, array_dim) { prob_array <- get_prob_array_from_vector(prob_vector, array_dim) jacobian <- matrix(0, Reduce("*", dim(prob_array)[1:3]), length(prob_vector)) ## Must be a faster, clearner way of populating jacobian for(i in seq_along(prob_vector)) { dummy_vector <- rep(0, length(prob_vector)) dummy_vector[i] <- 1 dummy_array <- get_prob_array_from_vector(dummy_vector, array_dim) dummy_array_sums <- apply(dummy_array, MARGIN=c(1, 2, 3), FUN=sum) jacobian_row_idx <- which(dummy_array_sums != 0, arr.ind=FALSE) stopifnot(length(jacobian_row_idx) == 1) jacobian[jacobian_row_idx, i] <- 1 } # Is there a fast, readable one-liner that does the same as this for loop? stopifnot(sum(jacobian) == length(prob_vector)) stopifnot(all(jacobian == 0 | jacobian == 1)) return(jacobian) } ## Example of a probability array satisfying my constraint my_prob_array <- array(0, array_dim) for(i in seq_len(array_dim[1])) { for(j in seq_len(array_dim[2])) { my_prob_array[i, j, , ] <- diag(array_dim[3]) } } my_prob_array[1, 1, , ] <- 1 / array_dim[3] my_prob_array[2, 1, , ] <- 0.25 * (1 / array_dim[3]) + 0.75 * diag(array_dim[3]) my_prob_vector <- as.vector(my_prob_array) # Flattened representation of my_prob_array should_be_zero_vector <- constraint_function(my_prob_vector, array_dim) is.vector(should_be_zero_vector) all(should_be_zero_vector == 0) # Constraint is satistied ## Check constraint_function_jacobian for correctness using numDeriv jacobian_analytical <- constraint_function_jacobian(my_prob_vector, array_dim) jacobian_numerical <- jacobian(constraint_function, my_prob_vector, array_dim=array_dim) max(abs(jacobian_analytical - jacobian_numerical)) # Very small

我的函数将 prob_vector 作为输入——即概率数组的扁平表示——因为优化函数需要向量参数。

Answer 1

花点时间了解你想做什么，但这里有一个提议可以取代你的 constraint_function_jacobian:

enhanced <- function(prob_vector, array_dim) {
  firstdim <- Reduce("*", array_dim[1:3])
  seconddim <- length(prob_vector)
  jacobian <- matrix(0, firstdim, seconddim)
  idxs <- split(1:seconddim, cut(1:seconddim, array_dim[4], labels=FALSE))
  for (i in seq_along(idxs)) {
    diag(jacobian[, idxs[[i]] ]) <- 1
  }
  stopifnot(sum(jacobian) == length(prob_vector))
  stopifnot(all(jacobian == 0 | jacobian == 1))
  jacobian
}

除非我错了，否则雅可比构造用 1 填充对角线，因为它不是方阵，我们必须在 array_dim[4] 方阵上拆分它以用 1 填充它们的对角线。

我确实摆脱了 prob_vector 到数组的转换，然后得到它的 dim 因为它将与 array_dim 相同，跳过这一步并不是很大改进但它简化了代码 IMO。

根据测试结果没问题：

identical(constraint_function_jacobian(my_prob_vector, array_dim),
          enhanced(my_prob_vector, array_dim))
# [1] TRUE

根据基准测试，它提供了很大的加速：

microbenchmark::microbenchmark(
  original=constraint_function_jacobian(my_prob_vector, array_dim),
  enhanced=enhanced(my_prob_vector, array_dim), times=100)

# Unit: microseconds
#     expr       min        lq      mean     median         uq       max neval cld
# original 16946.979 18466.491 20150.304 19066.7410 19671.4100 28148.035   100   b
# enhanced   678.222   737.948   799.005   796.3905   834.5925  1141.773   100  a

计算数组求和的雅可比矩阵的简洁方法

Clean way to compute jacobian of array summation

arrays

r

derivative

matrix-indexing