在 sqoop 中清理怎么样?

How about cleanup in sqoop?

我是 Sqoop 的新手。我不知道我问的问题对不对,如果我错了请指正。

当我使用 sqoop 执行导入操作将关系数据导入 HDFS 时,输出将存储在 HDFS 中。该过程完成后,数据仍然存在于 HDFS 端。

我的问题是,对于用户在 HDFS 端的每一个要求,都会创建一个文件,该文件将永久存在或在一段时间后删除

谢谢。

除非您明确删除,否则数据将保留在那里。您可以编写 cron 作业,它将按计划间隔删除数据。