bash 如何使用 CSV 从目录中删除文件

Question

我在一个目录中有 600,000 多张图片。文件名如下所示：

1000000-0.jpeg
1000000-1.jpeg
1000000-2.jpeg
1000001-0.jpeg
1000002-0.jpeg
1000003-0.jpeg

第一个数字是唯一 ID，第二个数字是索引。

{unique-id}-{index}.jpeg

如何从 .CSV 文件加载 unique-id 并删除其唯一 ID 与 .CSV 文件中的唯一 ID 匹配的每个文件？

CSV 文件如下所示：

1000000
1000001
1000002

... 或者我可以像这样用分号分隔（如有必要）：

1000000;1000001;1000002

Answer 1

如果每行只有一个 ID，这将显示所有匹配的文件名：

ls | grep -f unique-ids.csv

如果该列表看起来正确，您可以删除文件：

ls | grep -f unique-ids.csv | xargs rm

警告：这是一个快速而肮脏的解决方案。如果文件名都按照您所说的方式命名，它将起作用。当心它很容易被聪明的攻击者或特别倒霉的用户诱骗删除错误的东西。

Answer 2

您可以将 IFS 变量设置为 ; 并遍历读取到数组中的值：

#! /bin/bash
while IFS=';' read -a ids ; do
    for id in "${ids[@]}" ; do
        rm $id-*.jpg
    done
done < file.csv

首先使用 echo rm ... 尝试运行脚本以验证它是否符合您的要求。

Answer 3

您可以使用 find 和 sed:

find dir -regextype posix-egrep \
         -regex ".*($(sed 's/\;/|/g' ids.csv))-[0-9][0-9]*\.jpeg"

将 dir 替换为您的搜索目录，并将 ids.csv 替换为您的 CVS 文件。要删除文件，您可以包含 -delete 选项。

How to delete files from directory using CSV in bash