如何使用 NodeJS 将 PDF 转换为 DOCX 或将 URL 转换为 DOCX?

How to convert PDF to DOCX or URL to DOCX with NodeJS?

我正在尝试研究 NodeJS 中的 URL to DOCxPDF to DOCx 对话,但没有得到任何合适的解决方案。

我联系了 PhantomJS 但它转换 URL to PDF 有什么想法吗,Phantom 可以转换成 DOCX?

请就 docx 对话提出您的建议。

注意: HTML 不需要 Docx 内容 因为我在 HTML 页面上有地图和其他图表所以URL 需要。

很少有免费的开源实用程序可以将 HTML 转换为 DOCX,而能够很好地完成转换的就更少了,因此具体询问 Node.js 是非常具体的。如果您愿意编写一个简单的命令,您可以使用 pandoc 将 URL 转换为 DOCX。我建议先在没有 Node 的情况下在本地测试此实用程序。

pandoc -f html  -o 48656219.docx

免责声明: Pandoc 是一个标记转换器,而不是一个完整的 HTML 渲染器。这意味着您将没有完整的浏览器......例如您将丢失格式,并且通常会出现许多常见 HTML 和 CSS 技术的渲染问题。这是使用 pandoc 呈现的此页面:https://i.stack.imgur.com/LfUhw.png

如果它有效,那么您很幸运,因为有一个 npm 的 pandoc 包可用。 https://www.npmjs.com/package/node-pandoc

var pandoc = require('node-pandoc');
var src, args, callback;

src = '';
args = ['-f','html', '-o','48656219.docx'];

// Set your callback function 
callback = function (err, result) {

  if (err) {
    console.error('Oh Nos: ',err);
  }

  // For output to files, the 'result' will be a boolean 'true'. 
  // Otherwise, the converted value will be returned. 
  console.log(result);
  return result;
};

// Call pandoc 
pandoc(src, args, callback);