使用 MSER 检测图像中的文本

Detecting text in image using MSER

我正在尝试按照本教程 http://www.mathworks.com/help/vision/examples/automatically-detect-and-recognize-text-in-natural-images.html 使用 Matlab 检测图像中的文本。

作为第一步,本教程使用 detectMSERFeatures 来检测图像中的文本区域。但是,当我在图像上使用此步骤时,未检测到文本区域。

这是我正在使用的片段:

colorImage = imread('demo.png');
I = rgb2gray(colorImage);
% Detect MSER regions.
[mserRegions] = detectMSERFeatures(I, ...
    'RegionAreaRange',[200 8000],'ThresholdDelta',4);
figure
imshow(I)
hold on
plot(mserRegions, 'showPixelList', true,'showEllipses',false)
title('MSER regions')
hold off

这里是原图

这是第一步后的图像

[![在此处输入图片描述][2]][2]

更新

我试过参数,但 none 似乎可以完美地检测文本区域。有没有比调整数字更好的方法来实现这一点?调整参数不适用于我可能拥有的大量图像。

我尝试过的一些参数及其结果:

[mserRegions] = detectMSERFeatures(I, ...
    'RegionAreaRange',[30 100],'ThresholdDelta',12);



[mserRegions] = detectMSERFeatures(I, ...
    'RegionAreaRange',[30 600],'ThresholdDelta',12);

免责声明:完全未经测试。

尝试减少 MaxAreaVariation,因为您的文本和背景变化很小(减少误报)。你应该能够把它调低很多,因为它看起来像文本是数字生成的(如果它是文本图片就不会工作)。

尝试减小 RegionAreaRange 的最小值,因为小字符可能小于 200 像素(增加真阳性)。在 200,您可能过滤掉了大部分文本。

尝试增加 ThresholdDelta,因为您知道文本和背景之间存在鲜明对比(减少误报)。这在过滤方面不如 MaxAreaVariation 有效,但应该会有所帮助。