Cloud Data Fusion - trim 所有列的引号

Cloud Data Fusion - trim quotes for all columns

我在 GCS 中有一个 csv 文件，其中包含数百列用引号引起来的字段，如下所示：

"John","Doe","5/15/2021 7:18:26 PM"

我需要使用数据融合将其加载到 BigQuery，创建了一个管道。我的问题是

请指导我，阅读任何有关此类操作的好书也会有所帮助

出于测试目的，我使用了您的示例数据并添加了更多条目。

如果您的数据看起来像这样并且您的 objective 只是从数据中删除引号，您可以做的是：

您的输出将如下所示：

然后您可以将 CSV 转换为列：

这将告诉您的管理员将其读取为 CSV 并将逗号拆分为列。但原始数据将保留在列 body.

删除正文:

您的数据现在应该如下所示：