将 CSV 数据附加到 Apache Superset 数据集
Append CSV Data to Apache Superset Dataset
在 Apache Superset 中使用 CSV 上传按预期工作。我可以使用它将数据从 CSV 添加到数据库,例如Postgres。现在我想将来自不同 CSV 的数据应用到此 table/dataset。但是怎么办?
CSV 的格式都相同。但是每天都有一个新的。最后,我想要一个每天更新的仪表板,将新数据考虑在内。
创建一个简单的过程以将 CSV 加载到数据库中的 table,然后在 Superset 中查询该 table 可能会更好地为您服务。
Superset 是一种可视化数据的工具,它允许上传 CSV 用于快速和肮脏的“仅一次”类型的图表,但如果这将是经常性和结构化的周期性数据加载,最好使用您想要的任何集成工具加载数据,那里有无数的 ETL (Extract-Transform-Load) 工具(或脚本程序),询问您的公司是否已经在使用一种,或者选择对您来说更简单的一种。
总的来说,我同意 Ana 的观点,如果您想重复上传新的 CSV 数据,那么您最好将其应用到按计划运行的某种类型的流程、管道等中。
但是如果您需要坚持通过超集 UI 上传 CSV 路径,那么您可以将 Table Exists 字段设置为 附加而不是替换。
您可以在预设文档中找到有用的 GIF:https://docs.preset.io/docs/tips-tricks#append-csv-to-a-database
在 Apache Superset 中使用 CSV 上传按预期工作。我可以使用它将数据从 CSV 添加到数据库,例如Postgres。现在我想将来自不同 CSV 的数据应用到此 table/dataset。但是怎么办?
CSV 的格式都相同。但是每天都有一个新的。最后,我想要一个每天更新的仪表板,将新数据考虑在内。
创建一个简单的过程以将 CSV 加载到数据库中的 table,然后在 Superset 中查询该 table 可能会更好地为您服务。 Superset 是一种可视化数据的工具,它允许上传 CSV 用于快速和肮脏的“仅一次”类型的图表,但如果这将是经常性和结构化的周期性数据加载,最好使用您想要的任何集成工具加载数据,那里有无数的 ETL (Extract-Transform-Load) 工具(或脚本程序),询问您的公司是否已经在使用一种,或者选择对您来说更简单的一种。
总的来说,我同意 Ana 的观点,如果您想重复上传新的 CSV 数据,那么您最好将其应用到按计划运行的某种类型的流程、管道等中。
但是如果您需要坚持通过超集 UI 上传 CSV 路径,那么您可以将 Table Exists 字段设置为 附加而不是替换。
您可以在预设文档中找到有用的 GIF:https://docs.preset.io/docs/tips-tricks#append-csv-to-a-database