将边和顶点数组快速转换为图形格式

Converting an array of edges and vertices to a graph friedly format

我在 RDD 中提取了维基百科页面之间的链接,格式如下:

Array[(String, String)] = Array((AccessibleComputing,[Computer accessibility]), 
                      (Anarchism,[political philosophy, stateless society]))

第一个字符串是页面(顶点),第二个字符串是指向其他 Wiki 页面的链接列表(边)。

我怎样才能将它转换成这样的图形友好格式:

Array(
(AccessibleComputing,Computer accessibility),
(Anarchism,stateless society),
(Anarchism,political philosophy)
)

以便为每个顶点重复边

dropsplitflatMap?

data.flatMap{case (k, v) => v.drop(1).dropRight(1).split(", ").map((k, _))}