Spark GraphX 中完整图的分区策略

Partitioning Strategy For Complete Graph In Spark GraphX

我使用 Spark graphX 创建了一个图,其中每个顶点都直接连接到图的每个其他顶点,即 完整图 。 如果有人可以针对此类情况提出好的分区策略或实施自定义分区策略的任何想法,请提出建议。

我有100万个顶点和5亿条边。

任何与此相关的想法或建议将不胜感激。 提前致谢。

如果你有一个完整的图,你就不必关心复杂的分区算法。就拿 GraphX 已经实现的随机分区方法吧。

如果你有 n 个图顶点和 k 个分区,任何 balanced (edge-cut) partitioning strategy 都会为每个分区分配大约 n/k 个顶点,从而导致每个分区有 (n-n/k) 条出边到其他分区:每个顶点都连接到每个其他分区上的其他顶点。