从 python 中的 pdf 中提取页眉和页脚

Question

我使用 pdfminer 阅读了 pdf。我想检测 pdf 的页眉和页脚。如果有任何可能，请告诉我。

Answer 1

也可以使用 Apache Tika：

import tika
from tika import parser

FileName = "PDF File Name"
PDF_Parse = parser.from_file(FileName)
print(PDF_Parse ['content'])
print(PDF_Parse ['metadata']) # Format-Dictionary

从 python 中的 pdf 中提取页眉和页脚

Extract header and footer from pdf in python

python

pdfminer