不同字体大小的文本区域周围的边界框
Bounding boxes around text regions with different font size
我正在尝试实施某种文本检测算法,我想将图像分成多个区域,每个区域包含不同的字体大小。
如图所示,例如:
有什么简单的方法可以用python and/or opencv实现吗?如果可以,怎么做?
我确实尝试用谷歌搜索但找不到任何有用的东西..
谢谢
这是一个有趣的问题。为了实现您的目标,您需要采取几个步骤。我希望您充分了解基本的计算机视觉算法(openCV 函数方面的知识会有所帮助)以理解我建议的步骤。
- 使用形态膨胀过程将所有单词组合在一起。
- 使用 openCV findcountour 函数标记所有的斑点。这也会为您提供每个斑点的宽度和高度信息。
- 这是棘手的部分,现在您已经有了每个 blob 的数据,请尝试 运行 对数据使用位置 (x,y) 和几何形状 (width,height) 作为您的聚类算法功能。
- 一旦你正确地聚类它们,就是找到最左边、最右边、最上面和底部的数据来绘制边界矩形。
我希望这会为您提供足够的信息来开始您的工作。虽然不是很详细,但是我觉得足够指导你了。
我正在尝试实施某种文本检测算法,我想将图像分成多个区域,每个区域包含不同的字体大小。
如图所示,例如:
有什么简单的方法可以用python and/or opencv实现吗?如果可以,怎么做?
我确实尝试用谷歌搜索但找不到任何有用的东西..
谢谢
这是一个有趣的问题。为了实现您的目标,您需要采取几个步骤。我希望您充分了解基本的计算机视觉算法(openCV 函数方面的知识会有所帮助)以理解我建议的步骤。
- 使用形态膨胀过程将所有单词组合在一起。
- 使用 openCV findcountour 函数标记所有的斑点。这也会为您提供每个斑点的宽度和高度信息。
- 这是棘手的部分,现在您已经有了每个 blob 的数据,请尝试 运行 对数据使用位置 (x,y) 和几何形状 (width,height) 作为您的聚类算法功能。
- 一旦你正确地聚类它们,就是找到最左边、最右边、最上面和底部的数据来绘制边界矩形。
我希望这会为您提供足够的信息来开始您的工作。虽然不是很详细,但是我觉得足够指导你了。