使用 lambda 表达式理解 map() 函数的概念

Understanding the concept of map() function using lambda expression

这个 (x[1],0) 部分转换了什么?

rdd.map(lambda x : (x[1],0))

它为 rdd 中的每个项目创建一个元组。对于该 rdd 项 (x),该 rdd 项的第二个值 (x[1]) 与数字 0.

一起放置在正在创建的元组中

我没有安装 pyspark,所以我只是使用内置的 map 函数来展示这个转换是如何工作的:

>>> rdd = ['ab', 'xyz', 'jk', 'pq']
>>> list(map(lambda x : (x[1],0), rdd)) 
[('b', 0), ('y', 0), ('k', 0), ('q', 0)]