如何从带有文本的图像中获取每个字母的图像

How to get an image of each letter from image with text

F.E。我们有一份扫描的文本文件。目前，我已经编写了一个程序，可以获取字母图像并识别它。我现在不明白的是如何从整个扫描文档中获取每个文本符号的图像表示？可能吗？

作为基本技术，使用二值化和连通分量分析。这将为您提供 "blobs" 对应于各个字符，您可以获得它们的边界框。

你将面临额外的困难：

一些角色可以触摸并形成一个单一的斑点。您将需要一些检测逻辑来拆分它们，例如基于大小 and/or 错误的识别分数。在恶劣的情况下（几个触摸字符，宽度不均匀的字符），你将不得不尝试不同的分裂假设并保持最好的。
有些字符是由几个斑点组成的（例如带重音符号的字母），有些字符可能会显得支离破碎。当附近有小斑点时，您可以检测到这些情况。同样，您将不得不尝试对假设进行分组（冒着将不相关部分分组的风险）并保留最好的。
blob 将以随机顺序报告给您，您将需要一些额外的逻辑来按阅读顺序重新排列它们。