文本的光学识别及其结构分析（标题、副标题、文本body）

Optical recognition of text and analysis of its structure (title, subtitle, text body)

我们希望分析包含文本 (non-handwritten) 和图像的文档扫描件，这些文件具有非常广泛的 arrangements/structures 范围，使用不同的语言。我们尝试解决的第一个问题是提取文本并识别和分离标题、副标题和正文。

目前我们正在进行文献研究。关于深度学习、计算机视觉、光学字符识别或自然语言处理的文献很多，但其中 none 实际上侧重于文本结构的光学识别。

我们想知道，处理文本结构光学识别的discipline/field叫什么名字？

解决这些问题的 state-of-the-art 方法和工具是什么？

光学布局识别（OLR）。 open-source 布局分析和区域提取工具的一个很好的例子可以在 here.

中找到