使用 Poppler 将 PDF 转换为图像。它适用于一个文件,但在遍历 PDF 文件夹时不起作用?
Converting PDFs to Images using Poppler. It works for one file, but not when looping through a folder of PDFs?
我正在努力将 PDF 文件夹转换为 JPG 图像。我正在使用 Poppler,当我让它一次处理一张图像时,它就可以工作了。但是,当遍历文件夹中的每个 PDF 文件时,会出现以下错误:
"PDFInfoNotInstalledError: Unable to get page count. Is poppler installed and in PATH?"
因为我知道 Poppler 已安装并在 PATH 中(并且正在处理单个示例),所以我想知道我的循环是否以某种方式导致了这个问题?
对于上下文,请注意这在 Windows on Spyder in Anaconda 中被关闭; python-3.6.
from pdf2image import convert_from_path
import os
for filename in os.listdir(r".\I. Original Data\PDF Files"):
if filename.endswith(r".pdf"):
with open(os.path.join(r".\I. Original Data\PDF Files", filename)) as f:
pages = convert_from_path(f, 1000)
image_counter = 1
for page in pages:
filename = ".\II. Transformation\page_" + str(image_counter) + ".jpg"
page.save(filename, 'JPEG')
image_counter = image_counter + 1
我希望最终产品能够将每个 PDF 的每一页输出到引用的 'Transformation' 文件夹中的单独文件中。
谢谢!
for filename in os.listdir(r".\I. Original Data\PDF Files"):
filepath = (".\I. Original Data\PDF Files\" + filename)
pages = convert_from_path(filepath, 1000)
image_counter = 1
for page in pages:
file = ".\II. Transformation\" + str(os.path.splitext(filename)[0]) + "_page_" + str(image_counter) + ".jpg"
page.save(file, 'JPEG')
image_counter = image_counter + 1
我正在努力将 PDF 文件夹转换为 JPG 图像。我正在使用 Poppler,当我让它一次处理一张图像时,它就可以工作了。但是,当遍历文件夹中的每个 PDF 文件时,会出现以下错误: "PDFInfoNotInstalledError: Unable to get page count. Is poppler installed and in PATH?" 因为我知道 Poppler 已安装并在 PATH 中(并且正在处理单个示例),所以我想知道我的循环是否以某种方式导致了这个问题? 对于上下文,请注意这在 Windows on Spyder in Anaconda 中被关闭; python-3.6.
from pdf2image import convert_from_path
import os
for filename in os.listdir(r".\I. Original Data\PDF Files"):
if filename.endswith(r".pdf"):
with open(os.path.join(r".\I. Original Data\PDF Files", filename)) as f:
pages = convert_from_path(f, 1000)
image_counter = 1
for page in pages:
filename = ".\II. Transformation\page_" + str(image_counter) + ".jpg"
page.save(filename, 'JPEG')
image_counter = image_counter + 1
我希望最终产品能够将每个 PDF 的每一页输出到引用的 'Transformation' 文件夹中的单独文件中。
谢谢!
for filename in os.listdir(r".\I. Original Data\PDF Files"):
filepath = (".\I. Original Data\PDF Files\" + filename)
pages = convert_from_path(filepath, 1000)
image_counter = 1
for page in pages:
file = ".\II. Transformation\" + str(os.path.splitext(filename)[0]) + "_page_" + str(image_counter) + ".jpg"
page.save(file, 'JPEG')
image_counter = image_counter + 1