python 中用于 QR 检测的预处理图像

Preprocessing images for QR detection in python

我用Zbar和OpenCV读取了下图中的二维码,但都没有检测到。对于 ZBar,我使用 pyzbar 库作为 python 包装器。有些图像可以正确检测到二维码,有些图像与成功的图像非常相似,但失败了。我的 phone 相机可以读取上传图像中的二维码,这意味着它是有效的。下面是代码片段:

from pyzbar.pyzbar import decode
from pyzbar.pyzbar import ZBarSymbol
import cv2

# zbar    
results = decode(cv2.imread(image_path), symbols=[ZBarSymbol.QRCODE])
print(results) 

# opencv
qr_decoder = cv2.QRCodeDetector()
data, bbox, rectified_image = qr_decoder.detectAndDecode(cv2.imread(image_path))
print(data, bbox)

什么样的预处理有助于提高检测二维码的成功率?

zbar,做了一些预处理,没有检测二维码,可以测试运行 zbarimg image.jpg.

二值化在这里很有用。我使用 kraken.binarization.nlbin() function of the Kraken library. The library is for OCR, but works very well for QR codes, too, by using non-linear processing. The Kraken binarization code is here.

让这个工作

示例代码如下:

from kraken import binarization
from PIL import Image
from pyzbar.pyzbar import decode
from pyzbar.pyzbar import ZBarSymbol

image_path = "image.jpg"
# binarization using kraken
im = Image.open(image_path)
bw_im = binarization.nlbin(im)
# zbar
decode(bw_im, symbols=[ZBarSymbol.QRCODE])

[Decoded(data=b'DE-AAA002065', type='QRCODE', rect=Rect(left=1429, top=361, width=300, height=306), polygon=[Point(x=1429, y=361), Point(x=1429, y=667), Point(x=1729, y=667), Point(x=1723, y=365)])]

下图为二维码二值化后的清晰图像:

我遇到了类似的问题,Seanpue 的回答让我走上了解决这个问题的正确轨道。由于我已经在使用 OpenCV 库而不是 PIL 进行图像处理,因此我使用它根据 OpenCV tutorial on Image Thresholding 中的说明执行 Otsu 的二值化。这是我的代码:

import cv2
from pyzbar.pyzbar import decode
from pyzbar.pyzbar import ZBarSymbol

image_path = "qr.jpg"
# preprocessing using opencv
im = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)
blur = cv2.GaussianBlur(im, (5, 5), 0)
ret, bw_im = cv2.threshold(blur, 0, 255, cv2.THRESH_BINARY+cv2.THRESH_OTSU)
# zbar
decode(bw_im, symbols=[ZBarSymbol.QRCODE])

[Decoded(data=b'DE-AAA002065', type='QRCODE', rect=Rect(left=1429, top=362, width=300, height=305), polygon=[Point(x=1429, y=362), Point(x=1430, y=667), Point(x=1729, y=667), Point(x=1724, y=366)])]

应用高斯模糊应该可以消除图片中的噪声,使二值化更有效,但对于我的应用程序来说,它实际上并没有太大的区别。重要的是将图像转换为灰度以使阈值函数起作用(此处通过使用 cv2.IMREAD_GRAYSCALE 标志打开文件来完成)。