为什么应用高斯滤波器后图像的亮度降低了?
Why the brightness of the image got reduced after applying gaussian filter?
我刚刚从这个博客学习了如何从头开始将高斯滤波器应用于 python 中的灰度图像:
http://www.adeveloperdiary.com/data-science/computer-vision/applying-gaussian-smoothing-to-an-image-using-python-from-scratch/
现在我想将高斯滤波器应用于 3 通道 (RGB) 图像。
为此,我实现了代码,但我得到的输出是一个模糊的 暗淡 图像,亮度非常 低 。 此外,图像的边缘没有正确模糊。
这是我的代码:
# import libraries
import cv2
import numpy as np
import os
import matplotlib.pyplot as plt
%matplotlib inline
import cv2
# loading image
img_orig = cv2.imread('home.jpg')
# convert GBR image to RGB image
img_orig = cv2.cvtColor(img_orig, cv2.COLOR_BGR2RGB)
# Gaussian function
def dnorm(x, mu, sd):
return 1 / (np.sqrt(2 * np.pi) * sd) * np.exp(-((x-mu)/sd)** 2 / 2)
# function for making gaussian kernel
def gaussian_kernel(kernel_size, mu = 0):
# initializing mu and SD
sd = np.sqrt(kernel_size)
# creating 1D kernel
kernel_1D = np.linspace(-(kernel_size // 2), kernel_size // 2, kernel_size)
# normalizing 1D kernel
for i in range(kernel_size):
kernel_1D[i] = dnorm(kernel_1D[i], mu, sd)
# creating 2D kernel
kernel_2D = np.outer(kernel_1D, kernel_1D)
kernel_2D /= kernel_2D.max()
return kernel_2D
这是 11 X 11 内核的样子:
# Covolution function with zero padding
def convolution(image, kernel):
# find row and column of 3 channel (RGB) image
img_row, img_col, img_channel = image.shape
kernel_size = kernel.shape[0]
padding_width = (kernel_size - 1) // 2
#initialize output image
output = np.zeros(image.shape, dtype = np.uint8)
# initialize padded image with zeros
padded_img = np.zeros((img_row + 2*padding_width, img_col + 2*padding_width, img_channel), dtype = np.uint8)
# copy orignal image inside padded image
padded_img[padding_width : padding_width + img_row, padding_width : padding_width + img_col] = image
# average pixel values using gaussian kernel
for i in range(img_row):
for j in range(img_col):
# average each pixel's R channel value
output[i, j, 0] = np.sum(padded_img[i : i+kernel_size, j : j+kernel_size, 0] * kernel) // (kernel_size * kernel_size)
# average each pixel's G channel value
output[i, j, 1] = np.sum(padded_img[i : i+kernel_size, j : j+kernel_size, 1] * kernel) // (kernel_size * kernel_size)
# average each pixel's B channel value
output[i, j, 2] = np.sum(padded_img[i : i+kernel_size, j : j+kernel_size, 2] * kernel) // (kernel_size * kernel_size)
return output
def gaussian_filter(image, kernel_size = 3):
# initialize mu
mu = 0
# create gaussian kernel
kernel = gaussian_kernel(kernel_size, mu)
# apply convolution to image
conv_img = convolution(image, kernel)
# return blurred image
return conv_img
高斯滤波器测试代码:
plt.figure(figsize = (7, 5))
print('orignal image')
plt.imshow(img_orig)
plt.show()
plt.figure(figsize = (7, 5))
print('blurred image')
plt.imshow(gaussian_filter(img_orig, 11))
plt.show()
输出:
与 openCV GaussianBlur 对比:
print('openCV blurred image')
plt.imshow(cv2.GaussianBlur(img_orig, (11,11), 0))
plt.show()
输出:
我的问题是:
1) 为什么我得到一个暗淡的图像作为输出。
2) 上述 RGB 图像高斯滤波器的实现是否错误?如果写错了如何改正?
3) 为什么边缘没有适当模糊(看到边缘处的黑色阴影)?
4) 与 OpenCV GaussianBlur 相比,上述高斯滤波器的实现需要很长时间才能执行。我怎样才能让它更有效率?
导致图像强度无法保留的两件事是错误的:首先通过除以其最大值来归一化内核,然后在卷积中除以内核中的样本数。当您创建内核时,通过除以内核值的总和来仅规范化一次,而不是这两个规范化。这使得内核权重之和等于 1,并导致卷积保留平均图像强度。请注意,卷积计算局部加权平均值;在加权平均值中,我们需要将权重加到 1 以避免偏差。
暗边是由填充引起的:你用零(黑色)填充,它与卷积中图像边缘的值混合在一起。 OpenCV 可能使用不同的 边界条件 或图像填充。典型的选项涉及镜像值,或简单地扩展边缘值。
最后,您的代码运行缓慢的主要原因是您在 Python 中使用了循环。 Python 是一种解释性语言,因此速度很慢。您可以使用 Numba 来加速循环(它是 Python 的即时编译器),或者简单地使用 NumPy 中的卷积,它是用编译语言实现的。
你的代码速度慢的另一个原因(在你修复第一个之前这并不重要)是你没有利用高斯的可分离性。您可以通过将两个一维高斯相乘来构建一个二维高斯,但您可以按顺序应用两个一维卷积。对于您的 11x11 内核示例,计算成本从 11*11=121 次乘法和加法减少到 11+11=22 次乘法和加法。内核越大,速度增益越好。
大家好,我也是新手,如有不妥请指正。
除了 Cris Luengo 的回答,我认为它很棒,我还做了两个观察:
在output[i,j,0],output[i,j,1]和output[i,j,2]的计算中,从右边输出的是一个float,分配给左边的值,即 np.uint8,它所做的是忽略小数部分,即 1.9 -> 1。所以我认为在分配计算值之前使用 round() 可能会更好,所以那 1.9 -> 2
根据卷积的定义,我也是刚学的,在计算之前需要先把核倒过来,从左到右翻转,这是为了保持卷积的结合性。如您所知,高斯核是可分离的,这意味着您需要进行两次卷积,垂直和水平,关联确保顺序无关紧要。不过当然了,高斯核是对称的,你翻转不翻转都无所谓
我刚刚从这个博客学习了如何从头开始将高斯滤波器应用于 python 中的灰度图像:
http://www.adeveloperdiary.com/data-science/computer-vision/applying-gaussian-smoothing-to-an-image-using-python-from-scratch/
现在我想将高斯滤波器应用于 3 通道 (RGB) 图像。
为此,我实现了代码,但我得到的输出是一个模糊的 暗淡 图像,亮度非常 低 。 此外,图像的边缘没有正确模糊。
这是我的代码:
# import libraries
import cv2
import numpy as np
import os
import matplotlib.pyplot as plt
%matplotlib inline
import cv2
# loading image
img_orig = cv2.imread('home.jpg')
# convert GBR image to RGB image
img_orig = cv2.cvtColor(img_orig, cv2.COLOR_BGR2RGB)
# Gaussian function
def dnorm(x, mu, sd):
return 1 / (np.sqrt(2 * np.pi) * sd) * np.exp(-((x-mu)/sd)** 2 / 2)
# function for making gaussian kernel
def gaussian_kernel(kernel_size, mu = 0):
# initializing mu and SD
sd = np.sqrt(kernel_size)
# creating 1D kernel
kernel_1D = np.linspace(-(kernel_size // 2), kernel_size // 2, kernel_size)
# normalizing 1D kernel
for i in range(kernel_size):
kernel_1D[i] = dnorm(kernel_1D[i], mu, sd)
# creating 2D kernel
kernel_2D = np.outer(kernel_1D, kernel_1D)
kernel_2D /= kernel_2D.max()
return kernel_2D
这是 11 X 11 内核的样子:
# Covolution function with zero padding
def convolution(image, kernel):
# find row and column of 3 channel (RGB) image
img_row, img_col, img_channel = image.shape
kernel_size = kernel.shape[0]
padding_width = (kernel_size - 1) // 2
#initialize output image
output = np.zeros(image.shape, dtype = np.uint8)
# initialize padded image with zeros
padded_img = np.zeros((img_row + 2*padding_width, img_col + 2*padding_width, img_channel), dtype = np.uint8)
# copy orignal image inside padded image
padded_img[padding_width : padding_width + img_row, padding_width : padding_width + img_col] = image
# average pixel values using gaussian kernel
for i in range(img_row):
for j in range(img_col):
# average each pixel's R channel value
output[i, j, 0] = np.sum(padded_img[i : i+kernel_size, j : j+kernel_size, 0] * kernel) // (kernel_size * kernel_size)
# average each pixel's G channel value
output[i, j, 1] = np.sum(padded_img[i : i+kernel_size, j : j+kernel_size, 1] * kernel) // (kernel_size * kernel_size)
# average each pixel's B channel value
output[i, j, 2] = np.sum(padded_img[i : i+kernel_size, j : j+kernel_size, 2] * kernel) // (kernel_size * kernel_size)
return output
def gaussian_filter(image, kernel_size = 3):
# initialize mu
mu = 0
# create gaussian kernel
kernel = gaussian_kernel(kernel_size, mu)
# apply convolution to image
conv_img = convolution(image, kernel)
# return blurred image
return conv_img
高斯滤波器测试代码:
plt.figure(figsize = (7, 5))
print('orignal image')
plt.imshow(img_orig)
plt.show()
plt.figure(figsize = (7, 5))
print('blurred image')
plt.imshow(gaussian_filter(img_orig, 11))
plt.show()
输出:
与 openCV GaussianBlur 对比:
print('openCV blurred image')
plt.imshow(cv2.GaussianBlur(img_orig, (11,11), 0))
plt.show()
输出:
我的问题是:
1) 为什么我得到一个暗淡的图像作为输出。
2) 上述 RGB 图像高斯滤波器的实现是否错误?如果写错了如何改正?
3) 为什么边缘没有适当模糊(看到边缘处的黑色阴影)?
4) 与 OpenCV GaussianBlur 相比,上述高斯滤波器的实现需要很长时间才能执行。我怎样才能让它更有效率?
导致图像强度无法保留的两件事是错误的:首先通过除以其最大值来归一化内核,然后在卷积中除以内核中的样本数。当您创建内核时,通过除以内核值的总和来仅规范化一次,而不是这两个规范化。这使得内核权重之和等于 1,并导致卷积保留平均图像强度。请注意,卷积计算局部加权平均值;在加权平均值中,我们需要将权重加到 1 以避免偏差。
暗边是由填充引起的:你用零(黑色)填充,它与卷积中图像边缘的值混合在一起。 OpenCV 可能使用不同的 边界条件 或图像填充。典型的选项涉及镜像值,或简单地扩展边缘值。
最后,您的代码运行缓慢的主要原因是您在 Python 中使用了循环。 Python 是一种解释性语言,因此速度很慢。您可以使用 Numba 来加速循环(它是 Python 的即时编译器),或者简单地使用 NumPy 中的卷积,它是用编译语言实现的。
你的代码速度慢的另一个原因(在你修复第一个之前这并不重要)是你没有利用高斯的可分离性。您可以通过将两个一维高斯相乘来构建一个二维高斯,但您可以按顺序应用两个一维卷积。对于您的 11x11 内核示例,计算成本从 11*11=121 次乘法和加法减少到 11+11=22 次乘法和加法。内核越大,速度增益越好。
大家好,我也是新手,如有不妥请指正。 除了 Cris Luengo 的回答,我认为它很棒,我还做了两个观察:
在output[i,j,0],output[i,j,1]和output[i,j,2]的计算中,从右边输出的是一个float,分配给左边的值,即 np.uint8,它所做的是忽略小数部分,即 1.9 -> 1。所以我认为在分配计算值之前使用 round() 可能会更好,所以那 1.9 -> 2
根据卷积的定义,我也是刚学的,在计算之前需要先把核倒过来,从左到右翻转,这是为了保持卷积的结合性。如您所知,高斯核是可分离的,这意味着您需要进行两次卷积,垂直和水平,关联确保顺序无关紧要。不过当然了,高斯核是对称的,你翻转不翻转都无所谓