如何通过Selenium在网站上提取一个持续更新的Zip文件,然后解压为特定的文件名

how to extract a continuously updable Zip file on a website by Selenium and then unzip it for specific file names

我已经使用 Selenium x Python 每天下载一个 zip 文件,但在将它下载到我的本地下载文件夹后我目前面临一些问题

  1. 是否可以使用 Python 动态读取这些文件?假设日期总是不同的。我们可以简单地添加通配符*吗?我正在尝试将它从下载器文件夹移动到另一个文件夹,但它总是要求我完整地命名文件。

  2. 如何解压缩文件并在其中查找特定文件?假设这些文件将始终以文件名“ABC202103xx.csv”

    开头

非常感谢您的帮助!任何示例代码将不胜感激!

不知道本地文件夹中文件的确切名称通常不是问题。您可以只列出本地文件夹中的所有文件名,然后使用 for 循环查找所需的文件名。例如,假设您已将一个 zip 文件下载到“下载”文件夹中,并且您知道它被命名为“file-X.zip”,其中 X 是任何日期。

import os
for filename in os.listdir("Downloads"):
    if filename.startswith("file-") and filename.endswith(".zip"):
        filename_you_are_looking_for = filename
        break

要解压缩文件,我会向您推荐 this Whosebug 线程。同样,要在其中查找特定文件,您可以使用 os.listdir.