如何在 dupeguru 中过滤带有符号和非字母数字字符的特定扩展名

How to filter specific extension with symbol and non-alphanumeric character in dupeguru

对不起我的英语。

我正在尝试整理我的 ~7TB 数据。该 7TB 数据中有一些重复的文件和文件夹。 我想删除重复的文件,以便我有一些 space 来备份我的新数据(硬盘价格仍在上涨)。我目前的方法是使用dupeguru扫描删除文件夹和文件。

情况是:我已经删除了重复的文件夹,现在我想删除除了一些特定扩展名的文件之外的重复文件。

dupeguru中的过滤函数是Python正则表达式。 我尝试过滤照片和 xml 文件,我使用以下代码来完成这项工作。

^\w+\.png
^\w+\.jpg
^\w+\.xml

结果在这里:

X:\D\Desktop\sd\Pictures\FullSizeRender - Copy (2).jpg
X:\D\NEW\Old_System 3\Desktop\sd\Pictures\FullSizeRender - Copy (2).jpg

我发现我无法过滤名称中包含符号或 Mojibake 字符的文件。有什么问题?

你的表达太拘谨了。 \w[A-Za-z0-9_] 但您的文件名包含的字符远不止这些字符。 也许你可以相处:

^[-\w()\: ]+\.(?:jpg|png|xml)$

参见a demo on regex101.com