- 10/28
- 2020
-
QQ扫一扫
-
Vision小助手
(CMVU)
OCR(Optical Character Recognition, 光学字符识别)传统上指对输入扫描图像进行分析处理,识别出图像中文字信息。
图文识别预处理技术包含图像降噪、图像旋转校正、线检测、图像匹配、文字轮廓提取及分割等。确定OCR图像的种类,根据模板找出要识别的区域,提取和分割待识别的字符。预处理之后的 OCR 字符才可以进行识别,以保证识别的高精度。
针对不同的种类 OCR 图像,传统预处理过程采用的步骤可能不一样,但核心技术主要包括图像降噪、图像旋转校正、线检测、图像匹配、文字轮廓提取及分割等。
车轮
制动盘
OCR自动化应用
在车轮生产过程中需要对车轮进行检测,检测过程中进行车轮轮号的识别,现有车轮轮号识别采用人工进行,识别效率低,且存在主观识别错误的现象,影响车轮轮号的识别质量,为此,我们提出一种车轮轮号自动识别系统,以解决上述问题。
该系统不仅可兼容不同直径的车轮,还可以适用正反面的字符,且均为自动。
车轮OCR自动化应用
制动盘OCR自动化应用
OCR效果
因为车间现场受各种客观因素影响,导致图像成像效果差异大,从而给识别算法带来更大的困难,开异智能技术公司结合其自身优势,仔细分析原因,不断优化算法,从而很好的解决了各种问题。
车轮成像效果不一的图像
制动盘成像效果不一的情况
而正常情况下,应该是如下图。比如工件表面没有油污,粗糙度一致,字符宽度标准,间隔误差小,字符深浅误差小等条件。但客户在生产过程中,实际是无法正常满足这些要求的。
车轮成像效果很好的情况
制动盘成像效果很好的情况
该项目涉及最大的干扰因素就是因为成像效果差异大,如下图中的“2”和“4”,该连通的区域没有连通,但通过一些常规的参数调整,比如单个字符的长宽比以及分割参数,另外就是需要不断的以添加字库的形式进行模板匹配。
未正确设置好参数识别有问题
比较好的正确识别效果
当然,实际工况也会出现部分字符粘连,但肉眼看相机采集的图片是不会粘连,因为算法因素,导致初始状况不理想,但经过算法优化,稳定的解决了。
解决的大致原理如下:比如下图所示的3个字符中,“A“和”2“出现粘连采用普通的分割,则出现的情况如下图,明明是两个字符,由于分隔不够明显,程序认为它们是一个字符。这种情况我们如何处理呢?
使用形态学调整图像特征
这两个文字分隔不开的原因主要是在A字母的右下角与2的左下角连接到一起。
首先进行膨胀操作,我们的目的是为了将里面的黑色字体变得瘦一点,但是由于黑色字体周围有一圈白色的亮边,所以我们这里不能使用腐蚀操作,应该使用膨胀。
膨胀后字体是不是变瘦了呢?仅仅如此还是没有办法将A2两个文字分开,因为它们的白色部分连接到了一起。为了分开它们,我们可以使用斑点工具,将里面的黑色斑点文字取出来。效果如下图所示:
因为制动盘的字符在圆柱面上,且表面质量比较好,所以成像效果相对一致,字符识别难度比车轮简单很多,如下图所示。
制动盘识别结果
该项目成功的实施,不仅让生产现场的管控更加智能化,OCR的自动化应用,避免了人工的主观意识带来的弊端,也在整个高铁行业零部件身份ID可追溯贡献了一份力量。
- 上一条:茉丽特高性能特殊棱镜光学单元
- 下一条:虹科面向自动驾驶和多传感器的数据采集处理方案