从 python 中的 pdf 中提取页眉和页脚
Extract header and footer from pdf in python
我使用 pdfminer
阅读了 pdf。我想检测 pdf 的页眉和页脚。如果有任何可能,请告诉我。
也可以使用 Apache Tika:
import tika
from tika import parser
FileName = "PDF File Name"
PDF_Parse = parser.from_file(FileName)
print(PDF_Parse ['content'])
print(PDF_Parse ['metadata']) # Format-Dictionary
我使用 pdfminer
阅读了 pdf。我想检测 pdf 的页眉和页脚。如果有任何可能,请告诉我。
也可以使用 Apache Tika:
import tika
from tika import parser
FileName = "PDF File Name"
PDF_Parse = parser.from_file(FileName)
print(PDF_Parse ['content'])
print(PDF_Parse ['metadata']) # Format-Dictionary