虚拟打印机到 python

virtual printer to python

我正在寻求建议,如何制作这个。我需要制作虚拟打印机,当我将任何文本文件(word、excel、pdf)发送到这台打印机时,我希望我的 python 脚本可以获取此数据并将其解析为变量。只是 windows 平台。有什么想法吗?

这里我使用 Windows 通用文本打印机

从 Edge 打印了这个网页

从 windows 之前的日子开始,使用 Generic/Text 唯一的虚拟打印机是提取文本的常用方法。 结果变化很大。

已经向您展示了这是可能的。我要补充的是,由于多种原因,结果通常令人失望和沮丧。

因此,最好使用可编程 (API) 替代品,例如可以进行 OCR 等的替代品。

例如尝试格式化文本布局