在特征提取之前平滑图像

Smoothening the image before feature extraction

我正在使用 vl_phow 函数 (http://www.vlfeat.org/matlab/vl_phow.html),想知道为什么在特征提取之前应用平滑。

更具体地说,在 vl_phow 的文档中提到:

图像经过标准差SIZE / MAGNIF的高斯核平滑处理。注意,在标准的SIFT描述符中,放大值为3;这里默认的是 6,因为它似乎在应用程序中表现更好。

那么为什么要做这个平滑操作呢?

在同一文档中还有 WindowSize 选项,其解释如下:高斯 window 的大小,以空间箱为单位 。 Window 是用来平滑图像还是其他用途?

能不能告诉我为什么这样做,以及在特征提取之前对图像进行平滑处理的优点。

虽然这是一道数学题而不是 MATLAB 题,但我还是会去做。

SIFT 特征应该是图像中 "stand out" 的点。它们是具有高信息含量的特征,并且在不同的图像中将 "invariant"。

但是,嘈杂的图像可能 "noise" 看起来很重要。基本示例:

[0 0 0 0 0
 0 0 0 2 2
 0 1 0 2 2
 0 0 0 0 0]

如果不进行平滑处理,人们可能会认为那里有 2 个包含大量信息的区域,一个是 2s 的区域,一个是单个 1 的区域。但是,虽然带有 2s 的区域看起来确实是信息的一部分,因为有很多在一起,单个1的部分可能只是噪声,由于成像技术的噪声,在那里添加了一个小的随机值。

如果你用滤镜对图像进行平滑处理,你会得到类似的东西(虚构的例子)

[0 0    0 0   0
 0 0    0 1.9 2
 0 0.01 0 1.9 2
 0 0    0  0  0]

更明显的是,1 只是噪音,但 2 仍然存在。

这就是为什么特征提取算法(例如 SIFT)通常会在获取关键点之前对图像进行平滑处理。

平滑度越大 window,您会发现越强大的关键点,因为较小的东西会被删除。但是你也会发现更少的关键点。同样,如果它太大,您可能会删除真实信息(例如 2s int he)。

去除图像中的噪点。特征(通常是强度中的角点)会受到噪声的极大影响。

没有没有噪点的相机。除非你有一个人工图像,否则你的图像中总会有噪点。

这种噪音有很多来源,会随着时间、温度甚至位置而变化。

您会发现,对输入图像应用高斯模糊等低通滤波器或对多张照片进行平均是几乎所有图像处理操作的第一步。

否则,几乎不可能从相同的未更改场景中获得相同结果的两张图像。

要快速了解噪声源和降噪方法,请阅读: http://www.ijaiem.org/volume2issue11/IJAIEM-2013-11-24-070.pdf