可用于识别表面上的工业零件名称(粘贴或雕刻)的图像预处理方法?
image preprocessing methods that can be used for identification of industrial parts name (stuck or engraved) on the surface?
我正在做一个项目,我的任务是通过写在贴在机器上或刻在机器表面的标签上的部件号来识别机器部件。标签和雕刻部分的一个例子如下图所示。
我的任务是识别 9 或 10 个字母数字(第一张图片中的 03C 997 032 D 和第二张图片中的 357 955 531)。这似乎是一件容易的事,但是我在区分图像中的有用信息和其余部分时遇到了问题,即图像中还有许多其他数字和字符,我只想关注提到的数字。我尝试了很多事情,但到目前为止还没有成功。有谁知道我应该应用哪些图像预处理方法或任何 ML/DL 模型来获得预期结果?
提前致谢!
京东
您可以使用 OCR 从图像中获取所有字符,然后使用 regular expressions 提取所需的图案。
您可以使用 OCR 方法,例如 Tesseract。
也许,您想在 运行 文本识别系统之前清理图像,通过执行一些过滤来去除噪声/去除额外信息,例如:
- 转换为灰度(颜色不相关,不是吗?)
- 裁剪到感兴趣的区域
- Canny 过滤器
一个好的开始可以是本教程之一:
- OpenCV OCR with Tesseract (Python API)
- Recognizing text/number with OpenCV (C++ API)
我正在做一个项目,我的任务是通过写在贴在机器上或刻在机器表面的标签上的部件号来识别机器部件。标签和雕刻部分的一个例子如下图所示。
我的任务是识别 9 或 10 个字母数字(第一张图片中的 03C 997 032 D 和第二张图片中的 357 955 531)。这似乎是一件容易的事,但是我在区分图像中的有用信息和其余部分时遇到了问题,即图像中还有许多其他数字和字符,我只想关注提到的数字。我尝试了很多事情,但到目前为止还没有成功。有谁知道我应该应用哪些图像预处理方法或任何 ML/DL 模型来获得预期结果?
提前致谢! 京东
您可以使用 OCR 从图像中获取所有字符,然后使用 regular expressions 提取所需的图案。
您可以使用 OCR 方法,例如 Tesseract。
也许,您想在 运行 文本识别系统之前清理图像,通过执行一些过滤来去除噪声/去除额外信息,例如:
- 转换为灰度(颜色不相关,不是吗?)
- 裁剪到感兴趣的区域
- Canny 过滤器
一个好的开始可以是本教程之一:
- OpenCV OCR with Tesseract (Python API)
- Recognizing text/number with OpenCV (C++ API)