AI赋能，智造万物——基于深度学习和机器视觉的工业智能大脑--机器视觉网

“中国制造2025”是我国实施制造强国战略的第一步，是中国版的工业4.0（智能制造）。机器视觉是工业实现智能制造必不可少的重要技术。

机器视觉相当于人类视觉在机器上的延伸，让机器能够通过“眼睛”获取信息，通过智能算法做出判断，从而自适应工作环境中的非标准因素，实现工业非标自动化的流程。

然而，随着工业自动化水平的不断提高，传统机器视觉已经不能够满足一些更加复杂的应用场景：

无法预测模板中不存在的样本

当图像模板不足以覆盖可能出现的所有样本时，缺陷特征就很难通过提前设定的方式实现。

无法分析不规则、无规律的图像

当图像不规则、无规律时，很难按照经验手动设计特征，直接输出映射关系。

为更好的满足工业领域的各种行业需求，华睿科技在MVP智能算法平台中加入了强大的深度学习功能，可针对复杂多变的应用场景进行字符识别、缺陷检测、图像分类等功能。

深度学习OCR识别

字符检测涉及两个步骤，一是字符区域的提取，二是字符内容的识别。采用检测网络结合端到端的识别深度学习模型结合文字语义信息，可以实现对通用场景的识别，包括中文、字母、数字等。对于扭曲、形变、破损、过曝等具有较好的鲁棒性。在图像像素缺失时的字符检测率，通过对比，在检测背景下深度学习的字符识别准确率能比传统算法上升15%-20%，而复杂背景下的识别率能提升50%以上。

业界难题，轻松读取

对于传统的字符识别方法来说，点阵字符很难分割，无疑是字符识别的业界难题。应用华睿科技MVP智能算法平台深度学习OCR识别算子，可以轻松解决点阵OCR识别的难题。

点阵OCR识别

恶劣环境，毫无畏惧

在实际应用场景中，还会经常遇到字符质量较差，图像环境较为恶劣的情况，应用深度学习OCR识别，可以自适应字符的放缩、变形、扭曲、遮盖、残缺等各种变化。

多行字符，语义识别

将深度学习在复杂背景下自适应学习能力，应用于环境复杂的物流面单字符识别的应用场景中，可以在字符粘连、倾斜、褶皱等多种情况下进行识别，完成文本行定位，实现多行字符同时识别的功能。华睿科技经过多年在物流、邮政行业的深耕，积累了大量的语料库，可以识别出快递面单中各个地址的语义信息、电话信息以及各种非主流的网络用户名，轻松将面单信息录入系统。

深度学习缺陷检测

定位检测

将深度学习在复杂背景下的自适应学习能力，应用于不同物体表面的缺陷检测。首先将已知缺陷数据放入深度学习模型用于学习缺陷的基础特征和语义特征，接着利用上述模型区分缺陷区域和正常区域，最后标记出缺陷区域。这类模型只依赖于缺陷和背景的差异，具有良好的迁移能力，能应用于纸箱表面，金属表面和玻璃表面等不同场景。

xmwebp.webp.jpg

像素分类

深度学习在分割任务上要求对目标区域进行精细的区分，在像素上对目标和背景进行分类，输出热度图。在工业领域具有较广泛的应用，如织物、布匹、液晶等表面的脏污、破损，划痕等。

分类

目前深度学习应用于分类任务上，主要是通过物体之间的差异得出特征差异。然而物体的数量判断无法直接利用上述经验。设计一种自带空间特征的深度学习模型应用于物体的单双判断可以有效解决此类分类任务，场景复杂多变，包裹形态多样，存在相互交叠等情况，相比传统方法准确率从80%提升至99%以上。

深度学习应用于机器视觉系统，不仅需要对现有方法的研究和改进，还需要针对不同的使用场景，设计通用深度学习模型，一方面可以提高检测率并降低错误率，另一方面可以将模型迁移到不同场景。在物流，汽车，火车和智能制造领域，字符识别和缺陷检测已经取得比较满意的效果，而在其他领域，深度学习还有广阔发展的空间。