使用 lambda 表达式理解 map() 函数的概念
Understanding the concept of map() function using lambda expression
这个 (x[1],0)
部分转换了什么?
rdd.map(lambda x : (x[1],0))
它为 rdd 中的每个项目创建一个元组。对于该 rdd 项 (x
),该 rdd 项的第二个值 (x[1]
) 与数字 0
.
一起放置在正在创建的元组中
我没有安装 pyspark,所以我只是使用内置的 map 函数来展示这个转换是如何工作的:
>>> rdd = ['ab', 'xyz', 'jk', 'pq']
>>> list(map(lambda x : (x[1],0), rdd))
[('b', 0), ('y', 0), ('k', 0), ('q', 0)]
这个 (x[1],0)
部分转换了什么?
rdd.map(lambda x : (x[1],0))
它为 rdd 中的每个项目创建一个元组。对于该 rdd 项 (x
),该 rdd 项的第二个值 (x[1]
) 与数字 0
.
我没有安装 pyspark,所以我只是使用内置的 map 函数来展示这个转换是如何工作的:
>>> rdd = ['ab', 'xyz', 'jk', 'pq']
>>> list(map(lambda x : (x[1],0), rdd))
[('b', 0), ('y', 0), ('k', 0), ('q', 0)]