使用 MSER 检测图像中的文本
Detecting text in image using MSER
我正在尝试按照本教程 http://www.mathworks.com/help/vision/examples/automatically-detect-and-recognize-text-in-natural-images.html 使用 Matlab 检测图像中的文本。
作为第一步,本教程使用 detectMSERFeatures
来检测图像中的文本区域。但是,当我在图像上使用此步骤时,未检测到文本区域。
这是我正在使用的片段:
colorImage = imread('demo.png');
I = rgb2gray(colorImage);
% Detect MSER regions.
[mserRegions] = detectMSERFeatures(I, ...
'RegionAreaRange',[200 8000],'ThresholdDelta',4);
figure
imshow(I)
hold on
plot(mserRegions, 'showPixelList', true,'showEllipses',false)
title('MSER regions')
hold off
这里是原图
这是第一步后的图像
[![在此处输入图片描述][2]][2]
更新
我试过参数,但 none 似乎可以完美地检测文本区域。有没有比调整数字更好的方法来实现这一点?调整参数不适用于我可能拥有的大量图像。
我尝试过的一些参数及其结果:
[mserRegions] = detectMSERFeatures(I, ...
'RegionAreaRange',[30 100],'ThresholdDelta',12);
[mserRegions] = detectMSERFeatures(I, ...
'RegionAreaRange',[30 600],'ThresholdDelta',12);
免责声明:完全未经测试。
尝试减少 MaxAreaVariation
,因为您的文本和背景变化很小(减少误报)。你应该能够把它调低很多,因为它看起来像文本是数字生成的(如果它是文本图片就不会工作)。
尝试减小 RegionAreaRange
的最小值,因为小字符可能小于 200 像素(增加真阳性)。在 200,您可能过滤掉了大部分文本。
尝试增加 ThresholdDelta
,因为您知道文本和背景之间存在鲜明对比(减少误报)。这在过滤方面不如 MaxAreaVariation
有效,但应该会有所帮助。
我正在尝试按照本教程 http://www.mathworks.com/help/vision/examples/automatically-detect-and-recognize-text-in-natural-images.html 使用 Matlab 检测图像中的文本。
作为第一步,本教程使用 detectMSERFeatures
来检测图像中的文本区域。但是,当我在图像上使用此步骤时,未检测到文本区域。
这是我正在使用的片段:
colorImage = imread('demo.png');
I = rgb2gray(colorImage);
% Detect MSER regions.
[mserRegions] = detectMSERFeatures(I, ...
'RegionAreaRange',[200 8000],'ThresholdDelta',4);
figure
imshow(I)
hold on
plot(mserRegions, 'showPixelList', true,'showEllipses',false)
title('MSER regions')
hold off
这里是原图
这是第一步后的图像
[![在此处输入图片描述][2]][2]
更新
我试过参数,但 none 似乎可以完美地检测文本区域。有没有比调整数字更好的方法来实现这一点?调整参数不适用于我可能拥有的大量图像。
我尝试过的一些参数及其结果:
[mserRegions] = detectMSERFeatures(I, ...
'RegionAreaRange',[30 100],'ThresholdDelta',12);
[mserRegions] = detectMSERFeatures(I, ...
'RegionAreaRange',[30 600],'ThresholdDelta',12);
免责声明:完全未经测试。
尝试减少 MaxAreaVariation
,因为您的文本和背景变化很小(减少误报)。你应该能够把它调低很多,因为它看起来像文本是数字生成的(如果它是文本图片就不会工作)。
尝试减小 RegionAreaRange
的最小值,因为小字符可能小于 200 像素(增加真阳性)。在 200,您可能过滤掉了大部分文本。
尝试增加 ThresholdDelta
,因为您知道文本和背景之间存在鲜明对比(减少误报)。这在过滤方面不如 MaxAreaVariation
有效,但应该会有所帮助。