文本的光学识别及其结构分析(标题、副标题、文本body)
Optical recognition of text and analysis of its structure (title, subtitle, text body)
我们希望分析包含文本 (non-handwritten) 和图像的文档扫描件,这些文件具有非常广泛的 arrangements/structures 范围,使用不同的语言。我们尝试解决的第一个问题是提取文本并识别和分离标题、副标题和正文。
目前我们正在进行文献研究。关于深度学习、计算机视觉、光学字符识别或自然语言处理的文献很多,但其中 none 实际上侧重于文本结构的光学识别。
我们想知道,处理文本结构光学识别的discipline/field叫什么名字?
解决这些问题的 state-of-the-art 方法和工具是什么?
光学布局识别(OLR)。 open-source 布局分析和区域提取工具的一个很好的例子可以在 here.
中找到
我们希望分析包含文本 (non-handwritten) 和图像的文档扫描件,这些文件具有非常广泛的 arrangements/structures 范围,使用不同的语言。我们尝试解决的第一个问题是提取文本并识别和分离标题、副标题和正文。
目前我们正在进行文献研究。关于深度学习、计算机视觉、光学字符识别或自然语言处理的文献很多,但其中 none 实际上侧重于文本结构的光学识别。
我们想知道,处理文本结构光学识别的discipline/field叫什么名字?
解决这些问题的 state-of-the-art 方法和工具是什么?
光学布局识别(OLR)。 open-source 布局分析和区域提取工具的一个很好的例子可以在 here.
中找到