Windows 根据 PDF 文件本身的信息自动命名

Windows Automatic naming from info in PDF file itself

我正在尝试找到一种方法,将自动命名为“397009900”之类的扫描 pdf 转换为 PDF 本身内的某个字符串。在我的例子中,它是我试图从 PDF 中提取的绘图名称以重命名文件,即 "ISO-4024-4301"。

有没有办法使用其中的信息自动重命名 PDF 文件?

非常感谢。

这可以通过 python 来完成。

import PyPDF2
with open('path_to_file\Test doc.pdf', 'rb') as p:
    pdfReader = PyPDF2.PdfFileReader(p)
    pageObj = pdfReader.getPage(0)
    info=pageObj.extractText()
    print(info)

您可以指定要提取信息的页码。将要提取的页码从 0 开始更改。

pageObj = pdfReader.getPage(0)

提取的文本将存储在变量info中,然后您可以执行任何操作来选择要重命名的所需文本。

import os
os.rename(r'old_file_path_and_name_with_extension',r'new_file_path_and_name_with_extension')

使用OS模块,您可以轻松重命名文件!