从 python 中的 pdf 中提取页眉和页脚

Extract header and footer from pdf in python

我使用 pdfminer 阅读了 pdf。我想检测 pdf 的页眉和页脚。如果有任何可能,请告诉我。

也可以使用 Apache Tika:

import tika
from tika import parser

FileName = "PDF File Name"
PDF_Parse = parser.from_file(FileName)
print(PDF_Parse ['content'])
print(PDF_Parse ['metadata']) # Format-Dictionary