如何使用 Python 在现有 AVRO 文件中追加数据

How to append data in existing AVRO file using Python

我有一个具有类似架构的数据框,我需要将数据附加到 AVRO 文件中。我不喜欢将 avro 文件作为一部分添加到文件夹中。供您参考,我的 AVRO 文件没有作为一部分放入文件夹中。你能帮我解决这个任务吗?

您可以在写入dataframe时使用覆盖模式写入数据。

但是创建part文件是因为spark是分布式处理,每个executor根据数据量吐出一个文件