不同字体大小的文本区域周围的边界框

Bounding boxes around text regions with different font size

我正在尝试实施某种文本检测算法，我想将图像分成多个区域，每个区域包含不同的字体大小。

如图所示，例如：

有什么简单的方法可以用python and/or opencv实现吗？如果可以，怎么做？
我确实尝试用谷歌搜索但找不到任何有用的东西.. 谢谢

这是一个有趣的问题。为了实现您的目标，您需要采取几个步骤。我希望您充分了解基本的计算机视觉算法（openCV 函数方面的知识会有所帮助）以理解我建议的步骤。

使用形态膨胀过程将所有单词组合在一起。
使用 openCV findcountour 函数标记所有的斑点。这也会为您提供每个斑点的宽度和高度信息。
这是棘手的部分，现在您已经有了每个 blob 的数据，请尝试运行对数据使用位置 (x,y) 和几何形状 (width,height) 作为您的聚类算法功能。
一旦你正确地聚类它们，就是找到最左边、最右边、最上面和底部的数据来绘制边界矩形。

我希望这会为您提供足够的信息来开始您的工作。虽然不是很详细，但是我觉得足够指导你了。