将边和顶点数组快速转换为图形格式
Converting an array of edges and vertices to a graph friedly format
我在 RDD 中提取了维基百科页面之间的链接,格式如下:
Array[(String, String)] = Array((AccessibleComputing,[Computer accessibility]),
(Anarchism,[political philosophy, stateless society]))
第一个字符串是页面(顶点),第二个字符串是指向其他 Wiki 页面的链接列表(边)。
我怎样才能将它转换成这样的图形友好格式:
Array(
(AccessibleComputing,Computer accessibility),
(Anarchism,stateless society),
(Anarchism,political philosophy)
)
以便为每个顶点重复边
drop
、split
和 flatMap
?
data.flatMap{case (k, v) => v.drop(1).dropRight(1).split(", ").map((k, _))}
我在 RDD 中提取了维基百科页面之间的链接,格式如下:
Array[(String, String)] = Array((AccessibleComputing,[Computer accessibility]),
(Anarchism,[political philosophy, stateless society]))
第一个字符串是页面(顶点),第二个字符串是指向其他 Wiki 页面的链接列表(边)。
我怎样才能将它转换成这样的图形友好格式:
Array(
(AccessibleComputing,Computer accessibility),
(Anarchism,stateless society),
(Anarchism,political philosophy)
)
以便为每个顶点重复边
drop
、split
和 flatMap
?
data.flatMap{case (k, v) => v.drop(1).dropRight(1).split(", ").map((k, _))}