使用 python 移动多个文件并删除重复项

Using python to move multiple files and delete duplicates

除了 OS 之外,我应该使用什么特定的 libraries/modules 吗?我是初学者。

我有多个目录,其中包含许多文件的备份("organized" 在许多目录和文件的混乱组合中)。一些文件是唯一的,但大多数文件是重复的。我的硬盘上已经有一些文件,但不是全部。

我想从备份中收集所有唯一文件。如果我已经有这些文件(名称相同,文件类型是名称,文件大小相同),那么我可以删除备份文件。如果我还没有备份文件,那么我想将它移动到我的硬盘中。最后,我会销毁备份,我的硬盘将每个文件都有一个副本,没有重复。


这是一个例子:

My Hard Drive contains the following files: [apple, banana, pear]
Backup A contains the following files: [apple, pear, peach, tomato, carrot]
Backup B contains the following files: [apple, banana, pear, peach, tomato, carrot, potato]
Backup C contains the following files: [apple, banana, pear, peach, tomato, carrot, potato, celery]

在上面的例子中,我的程序首先将桃子、番茄和胡萝卜从备份A复制到我的硬盘,然后删除备份A。然后从第二个硬盘复制土豆,并删除备份B .然后它会从Backup C复制celery,并删除Backup C

我认为最好的情况是转到 Python 文档并访问:

  1. os module

  2. os.path module

  3. shutil module

这三个应该足以满足我在您的问题中看到的所有文件操作。但要注意您将编写的代码的破坏性,因为任何类型的代码片段都可能会弄乱您的文件。