查找 DAG 中节点值的累积和

Question

假设我有以下有向无环图 (DAG)，每个节点的权重为 1。

我感兴趣的是根据其祖先的值计算每个节点的累加和。假设我前面说了每个节点的权重都是1，那么这就是我期望得到的

这是我尝试做的：

 library(tidygraph, quietly = TRUE) 
 library(tidyverse)
 library(ggraph)

 # create adjacencies
 grafo_df <- tribble(
  ~from, ~to,
  "C", "A",
  "C", "B",
  "A", "D",
  "B", "D")
 
 # create the graph
 grafo <- as_tbl_graph(grafo_df)
 
 
 # calculate accumulated sum
 grafo %>% 
  arrange(node_topo_order()) %>% 
  mutate(
   
   revenue = 1,
   
   cum_weight = map_dfs(1, .f = function(node, path, ...) {
    
    sum(.N()$revenue[c(node, path$node)])
    
   })) %>% 
  as_tibble() %>% 
  unnest("cum_weight")
 
#> # A tibble: 4 x 3
#>   name  revenue cum_weight
#>   <chr>   <dbl>      <dbl>
#> 1 C           1          1
#> 2 A           1          2
#> 3 B           1          2
#> 4 D           1          3

^{由 reprex package (v2.0.0)}

于 2021-05-13 创建

如你所见，D的累加和结果是3而不是4，因为D的值应该是A和B的累加值之和，我不明白为什么D不加4

我试图理解给出的解决方案 here，但很难理解它

如何获取累计金额？

更新#1

我（暂时）不关心算法的复杂性，也就是说，如果算法在 O(V + E) 内完成它是不相关的。

this题中提到的一个重要的问题是关于两次计数的问题，即A的值的部分和等于C(1) + A(1) = 2 , B的值的部分和等于C(1) + B(1) = 2，所以说D的值不等于A(2) + B(2)的部分和因为 C 的值会重复我认为它不适用于这种情况，原因如下：

假设这 4 个节点（A、B、C 和 D）中的每一个都是互联网节点，每个节点产生 1 美元的收入，因此这 4 个节点的总累计收入为 4 美元。如果D是其余节点的汇聚节点，那么在D停止工作的场景下，其余节点的收益和D的收益将不再可能，因此其价值为$4。

更新#2

如果我添加一条从 C 到 D 的新路径，那么 D 的值应该始终为 4，因为依赖节点的数量保持不变，也就是说，重要的是累加和中依赖节点的数量。例如，在@ThomasIsCoding 提出的解决方案中，如果我添加这条新路径，D 的值现在为 5，我认为部分原因是他们的算法使用度数作为参数来计算累积和，但是，如果我添加一个附加节点则计算正确。

更新#3

我放置的示例很简单，目的是让 objective 易于理解，但是，我没有指定它应该适用于具有三种不同拓扑的许多节点的图.最外层是树，中间层是环，最里层是全网状。

Answer 1

这是一个 igraph 选项，使用 distance 和参数 mode = "in"

如果您的节点未加权，即所有节点 revenue=1

g <- graph_from_data_frame(grafo_df)

data.frame(name = names(V(g))) %>%
  mutate(revenue = 1) %>%
  mutate(cum_weight = rowSums((!is.infinite(distances(g, mode = "in"))) %*% diag(revenue)))

这给了你

  name revenue cum_weight
1    C       1          1
2    A       1          3
3    B       1          2
4    F       1          1
5    D       1          5

如果您的节点是加权的，例如，

data.frame(name = names(V(g))) %>%
  mutate(revenue = 1:n()) %>%
  mutate(cum_weight = rowSums((!is.infinite(distances(g, mode = "in"))) %*% diag(revenue)))

这给了你

  name revenue cum_weight
1    C       1          1
2    A       2          7
3    B       3          4
4    F       4          4
5    D       5         15

数据

grafo_df <- tribble(
  ~from, ~to,
  "C", "A",
  "C", "B",
  "A", "D",
  "C", "D",
  "B", "D",
  "F", "A"
)

plot(g) 的 DAG 给出为

Answer 2

现在问题很清楚了，所以我提出了一个算法，我不会编码，因为我不知道你用的是什么语言。

对于图中的每个节点Ni，我们将计算祖先集合Ai，那么每个节点的累加和将为|Ai| + 1.

用一个空的祖先集合初始化所有节点 Ai = {}
从包含所有节点的集合 S0 开始，没有传入边
初始化下一组Sn+1
迭代 Sn，对于每个节点 N:
对于具有来自 N 的入边的所有节点 D：
1. 将D的祖先集与N的祖先集加上N自身合并
2. 删除边 N->D
如果 D 没有其他传入边，将其添加到 Sn+1
如果Sn+1不为空，增加pass到n+1，从2开始重复

这个解决方案的最大限制是复杂性，稍后我会尝试找到一些优化的解决方案。

查找 DAG 中节点值的累积和

Finding the cumulative sum of the value of nodes in a DAG

algorithm

r

graph-theory

igraph

tidygraph