如何将 1200 万交互网络分解为子网络
How can I breaking up a 12 million interaction network into sub networks
我有一个 3 列列表,它表示具有以下结构的网络:
geneA geneB Spearman_Value
此列表包含 1200 万次互动。我想找到存在于 Spearman 值相似的较大网络中的子网络。我一直想做的是将列表分成许多不同的部分,并使用来自我们计算集群的不同节点处理每个部分。一个问题是节点需要能够看到列表的其他部分,以确定它们正在查看的交互是否是某个其他子网络的一部分。起初我认为我应该使用散列,因为它允许在 O(1) 时间内进行搜索,但这会导致键和/或值的重写。我一直在考虑创建一个数据结构,其中每个子网络都是一个链表,并且它们都以某种更大的结构(如散列)捆绑在一起。我不确定这是否有意义,因为我不知道如何以某种方式使每个密钥以任何有意义的方式识别不同的子网络。
最后我们使用 wcgna 解决了这个问题,并在我们的集群上执行了工作:
WCGNA
我有一个 3 列列表,它表示具有以下结构的网络:
geneA geneB Spearman_Value
此列表包含 1200 万次互动。我想找到存在于 Spearman 值相似的较大网络中的子网络。我一直想做的是将列表分成许多不同的部分,并使用来自我们计算集群的不同节点处理每个部分。一个问题是节点需要能够看到列表的其他部分,以确定它们正在查看的交互是否是某个其他子网络的一部分。起初我认为我应该使用散列,因为它允许在 O(1) 时间内进行搜索,但这会导致键和/或值的重写。我一直在考虑创建一个数据结构,其中每个子网络都是一个链表,并且它们都以某种更大的结构(如散列)捆绑在一起。我不确定这是否有意义,因为我不知道如何以某种方式使每个密钥以任何有意义的方式识别不同的子网络。
最后我们使用 wcgna 解决了这个问题,并在我们的集群上执行了工作: WCGNA