AWS Glue dynamicframe 使用 null 将 csv 写入 s3
AWS Glue dynamicframe writing csv to s3 with null
我有一个胶水作业,正在将动态帧写入 s3 中的 CSV,但由于某种原因,空值被删除了。解决这个问题的好方法是什么?
所需的 CSV 输出:
user_id, example_assignment, example_product
null, null, null
null, llama, null
null, null, feed
CSV 格式的当前输出:
user_id, example_assignment, example_product
,,
,llama,
,,feed
粘写 Csv:
glueContext.getSinkWithFormat(
connectionType = "s3",
options = example_path,
transformationContext = "example_transformation",
format = "csv"
).writeDynamicFrame(exampleDF)
因此目前 Glue 不提供 emptyValues option like Spark 写入。
您可以直接使用 Spark API,或者预先填充这些空值,例如,前面提到的来自 Glue 的 FillMissingValue Class。
我有一个胶水作业,正在将动态帧写入 s3 中的 CSV,但由于某种原因,空值被删除了。解决这个问题的好方法是什么?
所需的 CSV 输出:
user_id, example_assignment, example_product
null, null, null
null, llama, null
null, null, feed
CSV 格式的当前输出:
user_id, example_assignment, example_product
,,
,llama,
,,feed
粘写 Csv:
glueContext.getSinkWithFormat(
connectionType = "s3",
options = example_path,
transformationContext = "example_transformation",
format = "csv"
).writeDynamicFrame(exampleDF)
因此目前 Glue 不提供 emptyValues option like Spark 写入。
您可以直接使用 Spark API,或者预先填充这些空值,例如,前面提到的来自 Glue 的 FillMissingValue Class。