结合 SpqrkSQL 和 GraphX
Combine SpqrkSQL and GraphX
能否在 SparkSQL 中创建存储过程并调用 GraphX API?像这样:
registerFunction("storedProcedureGraphX", model.storedProcedureGraphX _)
select * from someTable where storedProcedureGraphX(nodeX, nodeY) > 10
如果 GraphX API 你的意思是对 RDD 的任何操作,那么答案是否定的。这将涉及为每一行启动新的 Spark 任务,这绝对不是一个好主意。而且您必须关闭不可序列化的 SparkContext
,而您用作 UDF 的函数必须是。
能否在 SparkSQL 中创建存储过程并调用 GraphX API?像这样:
registerFunction("storedProcedureGraphX", model.storedProcedureGraphX _)
select * from someTable where storedProcedureGraphX(nodeX, nodeY) > 10
如果 GraphX API 你的意思是对 RDD 的任何操作,那么答案是否定的。这将涉及为每一行启动新的 Spark 任务,这绝对不是一个好主意。而且您必须关闭不可序列化的 SparkContext
,而您用作 UDF 的函数必须是。