如何使用 pymupdf 将 doc 或 docx 文件转换为 PDF?
How to convert doc or docx file to PDF with pymupdf?
我正在尝试将一些文档文件转换为 PDF 我使用的是 docx2pdf 和 wincom32,但现在我想知道如何从 AWS Lambda 中完成此操作。
由于 docx2pdf 和 wincom32 需要在系统中安装 MS Office,因此我不能对我的 Lambda 使用相同的代码。
我尝试使用 pymupdf 转换文件但出现错误。
有人可以告诉我我做错了什么吗?或者有没有其他方法可以将 doc/docx 从 AWS Lambda 转换为 pdf。
import sys
import fitz
# convert an XPS file to PDF
doc = fitz.open("Resume.doc") ##Stored .doc location
pdfbytes = doc.convert_to_pdf()
pdfout = open("E:/email_download/Resume.pdf", "wb") ##PDF save location
pdfout.tobytes(pdfbytes)
pdfout.close()
RuntimeError Traceback (most recent call last)
~\AppData\Local\Temp/ipykernel_1812/2795759233.py in <module>
2 import fitz
3 # convert an XPS file to PDF
----> 4 doc = fitz.open("Resume.doc")
5 pdfbytes = doc.convert_to_pdf()
6
~\anaconda3\lib\site-packages\fitz\fitz.py in __init__(self, filename, stream, filetype, rect, width, height, fontsize)
3842 _fitz.Document_swiginit(
3843 self,
-> 3844 _fitz.new_Document(
3845 filename, stream, filetype, rect, width, height, fontsize
3846 ),
RuntimeError: no objects found
convert doc,docx to pdf from aws lambda
似乎我使用了不正确的库进行转换,我从上述文章中找到了一种将 doc、docx 转换为 pdf 的方法。
我正在尝试将一些文档文件转换为 PDF 我使用的是 docx2pdf 和 wincom32,但现在我想知道如何从 AWS Lambda 中完成此操作。
由于 docx2pdf 和 wincom32 需要在系统中安装 MS Office,因此我不能对我的 Lambda 使用相同的代码。
我尝试使用 pymupdf 转换文件但出现错误。
有人可以告诉我我做错了什么吗?或者有没有其他方法可以将 doc/docx 从 AWS Lambda 转换为 pdf。
import sys
import fitz
# convert an XPS file to PDF
doc = fitz.open("Resume.doc") ##Stored .doc location
pdfbytes = doc.convert_to_pdf()
pdfout = open("E:/email_download/Resume.pdf", "wb") ##PDF save location
pdfout.tobytes(pdfbytes)
pdfout.close()
RuntimeError Traceback (most recent call last)
~\AppData\Local\Temp/ipykernel_1812/2795759233.py in <module>
2 import fitz
3 # convert an XPS file to PDF
----> 4 doc = fitz.open("Resume.doc")
5 pdfbytes = doc.convert_to_pdf()
6
~\anaconda3\lib\site-packages\fitz\fitz.py in __init__(self, filename, stream, filetype, rect, width, height, fontsize)
3842 _fitz.Document_swiginit(
3843 self,
-> 3844 _fitz.new_Document(
3845 filename, stream, filetype, rect, width, height, fontsize
3846 ),
RuntimeError: no objects found
convert doc,docx to pdf from aws lambda
似乎我使用了不正确的库进行转换,我从上述文章中找到了一种将 doc、docx 转换为 pdf 的方法。