将spark中两个rdds的值相除(python)

Divide the values of two rdds in spark (python)

我在 spark 中有这两个键值 RDD:

rdd1 = [(u'Key1', 4), (u'Key2', 6), (u'Key3', 10)]
rdd2 = [(u'Key1', 4), (u'Key2', 3), (u'Key3', 2)]

然后我查看 spark 函数以获得值的除法:(rdd3= (rdd1/rdd2))

在这种情况下:

rdd3 = [(u'Key1', 1), (u'Key2', 2), (u'Key3', 5)]

您可以 joinmapValues:

rdd1.join(rdd2).mapValues(lambda x: x[0] / x[1])