如何在 Scala 中将 DataFrame 转换为 DynamicFrame 对象

How to convert DataFrame to DynamicFrame object in Scala

我正在尝试将我的一些 pySpark 代码转换为 Scala 以提高性能。在 AWS Glue(使用 Apache Spark)中,会自动为您生成一个脚本,它通常使用 DynamicFrame 对象来加载、转换和写出数据。但是,DynamicFrame class 不具有与 DataFrame class 相同的所有功能,有时您必须转换回 DataFrame 对象,反之亦然才能执行某些操作。下面是我如何在 pySpark 中从 DataFrame 转换为 DynamicFrame 对象:

    // PySpark version
    // datasource is a DynamicFrame object
    datasource0 = datasource.toDF().limit(5000000)
    applymapping1 = DynamicFrame.fromDF(datasource0, glueContext, "applymapping1")

Scala 中是否有与 fromDF 等效的函数来还原为 DynamicFrame 对象?

DynamicFrame 对象有一个 apply method:

val dynamicFrame = DynamicFrame(dataframe, glueContext)