用 Python 的 "wget" 覆盖现有文件?

Overwrite existing files with Python's "wget"?

我已经在 Python 上安装了 wget,我正在使用它从不同的 URL 下载文件。到目前为止,我的代码如下所示:

import wget
urls = ['https://www.iedb.org/downloader.php?file_name=doc/epitope_full_v3.zip', 
        'https://www.iedb.org/downloader.php?file_name=doc/tcell_full_v3.zip',
        'https://www.iedb.org/downloader.php?file_name=doc/bcell_full_v3.zip', 
        'https://www.iedb.org/downloader.php?file_name=doc/mhc_ligand_full_single_file.zip']
path = '/home/david/data/files/zip_files'

for url in urls:
   wget.download(url, path)

我希望我的代码覆盖下载的文件(如果它们存在),这样每次我 运行 代码我都会获得该文件的最新版本,而不是保留旧文件并下载新文件具有不同名称的(例如,如果 epitope_full_v3.zip 已经存在,当我执行代码时它将再次下载它,但会保留旧的并将新的重命名为 epitope_full_v3_1.zip)。

我知道 wget 可以在 shell 中接受一个 -O 参数,允许您这样做,但我没有在文档中看到 python 版本的那个。感谢您的帮助。

虽然wget没有提到,你可以通过yourself.Use os.path.basename() 来修改它来获取文件名,并检查它是否exists.Like this:

import wget
import os

urls = ['https://www.iedb.org/downloader.php?file_name=doc/epitope_full_v3.zip',
        'https://www.iedb.org/downloader.php?file_name=doc/tcell_full_v3.zip',
        'https://www.iedb.org/downloader.php?file_name=doc/bcell_full_v3.zip',
        'https://www.iedb.org/downloader.php?file_name=doc/mhc_ligand_full_single_file.zip']

path = '/home/david/data/files/zip_files'

for url in urls:
    filename = path + '/' + os.path.basename(url) # get the full path of the file
    if os.path.exists(filename):
        os.remove(filename) # if exist, remove it directly
    wget.download(url, out=filename) # download it to the specific path.