JODConverter & LibreOffice:将 doc 转换为 html 并嵌入图像
JODConverter & LibreOffice: convert doc to html with embedded images
我正在使用 JODConverter 库 (4.2.2) 和 LibreOffice (6.2) 将 doc/docx 文件转换为 html。我需要的是将图像保存为嵌入 html 文件中,但默认情况下它保存在单独的文件中。
为了使用 LibreOffice 命令行界面做到这一点,我正在使用:
soffice --convert-to html:HTML:EmbedImages example.docx
我想知道是否有任何方法可以通过 JODConverter 库传递选项 EmbedImages?
我的java代码:
LocalConverter
.make()
.convert(new FileInputStream(docFile))
.as(DefaultDocumentFormatRegistry.getFormatByMediaType(file.getMediaType().getName()))
.to(htmlTempFile)
.as(DefaultDocumentFormatRegistry.HTML)
.execute();
这可行:
final DocumentFormat format =
DocumentFormat.builder()
.from(DefaultDocumentFormatRegistry.HTML)
.storeProperty(DocumentFamily.TEXT, "FilterOptions", "EmbedImages")
.build();
LocalConverter
.make()
.convert(new FileInputStream(docFile))
.as(DefaultDocumentFormatRegistry.getFormatByMediaType(file.getMediaType().getName()))
.to(htmlTempFile)
.as(format)
.execute();
我正在使用 JODConverter 库 (4.2.2) 和 LibreOffice (6.2) 将 doc/docx 文件转换为 html。我需要的是将图像保存为嵌入 html 文件中,但默认情况下它保存在单独的文件中。
为了使用 LibreOffice 命令行界面做到这一点,我正在使用:
soffice --convert-to html:HTML:EmbedImages example.docx
我想知道是否有任何方法可以通过 JODConverter 库传递选项 EmbedImages?
我的java代码:
LocalConverter
.make()
.convert(new FileInputStream(docFile))
.as(DefaultDocumentFormatRegistry.getFormatByMediaType(file.getMediaType().getName()))
.to(htmlTempFile)
.as(DefaultDocumentFormatRegistry.HTML)
.execute();
这可行:
final DocumentFormat format =
DocumentFormat.builder()
.from(DefaultDocumentFormatRegistry.HTML)
.storeProperty(DocumentFamily.TEXT, "FilterOptions", "EmbedImages")
.build();
LocalConverter
.make()
.convert(new FileInputStream(docFile))
.as(DefaultDocumentFormatRegistry.getFormatByMediaType(file.getMediaType().getName()))
.to(htmlTempFile)
.as(format)
.execute();