如何使用 pymupdf 将 doc 或 docx 文件转换为 PDF？

Question

我正在尝试将一些文档文件转换为 PDF 我使用的是 docx2pdf 和 wincom32，但现在我想知道如何从 AWS Lambda 中完成此操作。

由于 docx2pdf 和 wincom32 需要在系统中安装 MS Office，因此我不能对我的 Lambda 使用相同的代码。

我尝试使用 pymupdf 转换文件但出现错误。

有人可以告诉我我做错了什么吗？或者有没有其他方法可以将 doc/docx 从 AWS Lambda 转换为 pdf。

import sys
import fitz
# convert an XPS file to PDF
doc = fitz.open("Resume.doc") ##Stored .doc location
pdfbytes = doc.convert_to_pdf()

pdfout = open("E:/email_download/Resume.pdf", "wb") ##PDF save location
pdfout.tobytes(pdfbytes)
pdfout.close()

RuntimeError                              Traceback (most recent call last)
~\AppData\Local\Temp/ipykernel_1812/2795759233.py in <module>
      2 import fitz
      3 # convert an XPS file to PDF
----> 4 doc = fitz.open("Resume.doc")
      5 pdfbytes = doc.convert_to_pdf()
      6 

~\anaconda3\lib\site-packages\fitz\fitz.py in __init__(self, filename, stream, filetype, rect, width, height, fontsize)
   3842         _fitz.Document_swiginit(
   3843             self,
-> 3844             _fitz.new_Document(
   3845                 filename, stream, filetype, rect, width, height, fontsize
   3846             ),

RuntimeError: no objects found

Answer 1

convert doc,docx to pdf from aws lambda

似乎我使用了不正确的库进行转换，我从上述文章中找到了一种将 doc、docx 转换为 pdf 的方法。

如何使用 pymupdf 将 doc 或 docx 文件转换为 PDF？

How to convert doc or docx file to PDF with pymupdf?

python

libreoffice

aws-lambda

pymupdf