使用 filter2D (OpenCV) 进行 Sobel 运算符时,平方会引入大量噪声
Squaring introduces a lot of noise when doing Sobel operator using filter2D (OpenCV)
我正在尝试手动实现 sobel 运算符。
由于某些原因,算子的水平和垂直分量似乎有很好的效果,但合并后的图像有很多噪声。
我注意到,当我执行类似 (imgv**2)**0.5 的操作时,也会引入大量噪声,尽管理想情况下,我应该得到大致相同的图像。
有人知道这里发生了什么吗?我应该以不同的方式组合图像吗?
这是我在 python 中的代码:
import cv2
import numpy as np
sobelX = np.array([[1,0,-1],[2,0,-2],[1,0,-1]])
sobelY = sobelX.T
imgoriginal = cv2.imread("building.bmp")
imgv = cv2.filter2D(imgoriginal, -1, sobelY)
imgh = cv2.filter2D(imgoriginal, -1, sobelX)
imgboth = (imgv**2 + img**2)**0.5
这是输出:
更新:一种更好的方法。
#!/usr/bin/python3
# 2017.12.22 21:48:22 CST
import cv2
import numpy as np
## parameters
sobelX = np.array([[1,0,-1],[2,0,-2],[1,0,-1]])
sobelY = sobelX.T
ddepth = cv2.CV_16S
## calc gx and gy
#img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
img = cv2.GaussianBlur(img, (3,3), 0)
gx = cv2.filter2D(img, ddepth, sobelX)
gy = cv2.filter2D(img, ddepth, sobelY)
## calc gridxy
gxabs = cv2.convertScaleAbs(gx)
gyabs = cv2.convertScaleAbs(gy)
grad = cv2.addWeighted(gxabs, 0.5, gyabs, 0.5, 0)
cv2.imwrite("result.png", grad)
原回答:
是啊,在numpy中对opencv图像进行数学运算时一直困扰着我。图片数据类型默认为np.uint8。因此,如果不更改 .
进行数学运算时,可能 overflow/underflow
试试这个:
import cv2
import numpy as np
sobelX = np.array([[1,0,-1],[2,0,-2],[1,0,-1]])
sobelY = sobelX.T
img = cv2.imread("cat.png")
## Change the color space
#img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
imgv = cv2.filter2D(img, -1, sobelY)
imgh = cv2.filter2D(img, -1, sobelX)
## Change the percision first, then do math operation
imghv = (np.float32(imgv)**2 + np.float32(img)**2)**0.5
#imghv = (np.float32(imgv)**2 + np.float32(img)**2)**0.5
## Normalize and change the percision
## Use cv2.convertScaleAbs() to convert value into the right range [0, 255]
imghv = imghv/imghv.max()*255
imghv = cv2.convertScaleAbs(imghv)
## Display
res = np.hstack((imgh, imgv, imghv))
cv2.imshow("Sobel", res)
cv2.waitKey()
cv2.destroyAllWindows()
我正在尝试手动实现 sobel 运算符。
由于某些原因,算子的水平和垂直分量似乎有很好的效果,但合并后的图像有很多噪声。
我注意到,当我执行类似 (imgv**2)**0.5 的操作时,也会引入大量噪声,尽管理想情况下,我应该得到大致相同的图像。
有人知道这里发生了什么吗?我应该以不同的方式组合图像吗?
这是我在 python 中的代码:
import cv2
import numpy as np
sobelX = np.array([[1,0,-1],[2,0,-2],[1,0,-1]])
sobelY = sobelX.T
imgoriginal = cv2.imread("building.bmp")
imgv = cv2.filter2D(imgoriginal, -1, sobelY)
imgh = cv2.filter2D(imgoriginal, -1, sobelX)
imgboth = (imgv**2 + img**2)**0.5
这是输出:
更新:一种更好的方法。
#!/usr/bin/python3
# 2017.12.22 21:48:22 CST
import cv2
import numpy as np
## parameters
sobelX = np.array([[1,0,-1],[2,0,-2],[1,0,-1]])
sobelY = sobelX.T
ddepth = cv2.CV_16S
## calc gx and gy
#img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
img = cv2.GaussianBlur(img, (3,3), 0)
gx = cv2.filter2D(img, ddepth, sobelX)
gy = cv2.filter2D(img, ddepth, sobelY)
## calc gridxy
gxabs = cv2.convertScaleAbs(gx)
gyabs = cv2.convertScaleAbs(gy)
grad = cv2.addWeighted(gxabs, 0.5, gyabs, 0.5, 0)
cv2.imwrite("result.png", grad)
原回答:
是啊,在numpy中对opencv图像进行数学运算时一直困扰着我。图片数据类型默认为np.uint8。因此,如果不更改 .
进行数学运算时,可能 overflow/underflow试试这个:
import cv2
import numpy as np
sobelX = np.array([[1,0,-1],[2,0,-2],[1,0,-1]])
sobelY = sobelX.T
img = cv2.imread("cat.png")
## Change the color space
#img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
imgv = cv2.filter2D(img, -1, sobelY)
imgh = cv2.filter2D(img, -1, sobelX)
## Change the percision first, then do math operation
imghv = (np.float32(imgv)**2 + np.float32(img)**2)**0.5
#imghv = (np.float32(imgv)**2 + np.float32(img)**2)**0.5
## Normalize and change the percision
## Use cv2.convertScaleAbs() to convert value into the right range [0, 255]
imghv = imghv/imghv.max()*255
imghv = cv2.convertScaleAbs(imghv)
## Display
res = np.hstack((imgh, imgv, imghv))
cv2.imshow("Sobel", res)
cv2.waitKey()
cv2.destroyAllWindows()