如何转换 Pyspark 中 Dataframe 中的列表列表?
How can I convert a list of lists in a Dataframe in Pyspark?
我有一个列表类型的列表:
[[1, 'A', 'aa'], [2 'B', 'bb'], [3, 'C', 'cc']]
我想获取下一个数据帧:
id
col1
col2
1
A
aa
2
B
bb
3
C
cc
这个解决方案有点相似,但是列表中有来自相同列的数据
只需使用列表直接创建数据框。
data = [[1, 'A', 'aa'], [2, 'B', 'bb'], [3, 'C', 'cc']]
df = spark.createDataFrame(data, ['id', 'col1', 'col2'])
df.show(truncate=False)
我有一个列表类型的列表:
[[1, 'A', 'aa'], [2 'B', 'bb'], [3, 'C', 'cc']]
我想获取下一个数据帧:
id | col1 | col2 |
---|---|---|
1 | A | aa |
2 | B | bb |
3 | C | cc |
这个解决方案有点相似,但是列表中有来自相同列的数据
只需使用列表直接创建数据框。
data = [[1, 'A', 'aa'], [2, 'B', 'bb'], [3, 'C', 'cc']]
df = spark.createDataFrame(data, ['id', 'col1', 'col2'])
df.show(truncate=False)