使用 wget 下载具有重复名称的链接列表
download a list of links with reptitive names with wget
我有一个链接列表,但是有不同文件的同名链接。这是我的 to_download.txt
文件的片段:
https://www.url.domain/world/2000/may/15/one
https://www.url.domain/world/2000/nov/07/two
https://www.url.domain/world/2000/nov/17/three
https://www.url.domain/world/2000/apr/17/two
https://www.url.domain/world/2000/feb/13/one
https://www.url.domain/world/2000/jun/26/three
https://www.url.domain/world/2000/apr/25/one
当我使用 wget -i /to_download.txt
时,只有一个文件用于具有重复文件名的 URL(一个 one
、一个 two
、一个 three
等)
因为你正在覆盖文件。不能有两个同名的文件。您可以为每个月或任何模式创建单独的文件夹。
这就是我最后做的。假设所有链接都在名为 l
:
的列表中
for url in l:
n = url.split('/')
name = n[-1] + '_' + n[-2] + '_' + n[-3] + '_' + n[-4]
os.system('wget ' + url + ' -O ' + name)
我认为这不是最好的解决方案,但它解决了我的问题。
我有一个链接列表,但是有不同文件的同名链接。这是我的 to_download.txt
文件的片段:
https://www.url.domain/world/2000/may/15/one
https://www.url.domain/world/2000/nov/07/two
https://www.url.domain/world/2000/nov/17/three
https://www.url.domain/world/2000/apr/17/two
https://www.url.domain/world/2000/feb/13/one
https://www.url.domain/world/2000/jun/26/three
https://www.url.domain/world/2000/apr/25/one
当我使用 wget -i /to_download.txt
时,只有一个文件用于具有重复文件名的 URL(一个 one
、一个 two
、一个 three
等)
因为你正在覆盖文件。不能有两个同名的文件。您可以为每个月或任何模式创建单独的文件夹。
这就是我最后做的。假设所有链接都在名为 l
:
for url in l:
n = url.split('/')
name = n[-1] + '_' + n[-2] + '_' + n[-3] + '_' + n[-4]
os.system('wget ' + url + ' -O ' + name)
我认为这不是最好的解决方案,但它解决了我的问题。