日期
11/24
2022
咨询
  • QQ扫一扫

  • Vision小助手
    (CMVU)

不调参,免训练,维视智造VisionBank AI OCR新功能升级上线!
收藏
2022-11-24 16:57:23来源: 中国机器视觉网

应用背景

OCR字符识别,是指对部件或产品上刻印的字符进行确认、辨别、判定的检测识别。此项技术目前已广泛应用于工业自动化生产的产品质量管理环节当中,企业通过为机器视觉检测设备安装OCR系统,快速完成对产品生产日期、保质期、生产批号、条码等字符信息的检测,从而更好地进行产品管理和追溯。

应用现状

作为机器视觉的典型应用方向,OCR的工作原理即为:通过工业相机、工业镜头拍摄字符图像,运用机器视觉软件进行相应处理分析,判定被检产品是否合格,并输出检测结果和相应信号。

这其中,软件处理环节才是OCR技术真正的“用武之地”。常规的技术处理流程为:背景图像处理——字符切割——字符注册——字符识别与判断——结果输出。

微信图片_20221124165808.png

实际的工业应用中,软件的处理过程都会在短时间内完成。但由于字符组合的复杂性、字符印刷材质的多样性、以及生产过程中产生的多类字符缺损,为了保证字符识别的精准度,就需要在软件系统中进行大量的标注训练和调参工作,这在一定程度上增加了软件使用的复杂度,拉长了落地投产时间。

尤其在物流行业发展快速,电商全面覆盖的今天,产品SKU的极大丰富,生产效率要求的进一步提高,OCR的处理速度也就相应的需要新的技术进行升级。

新功能介绍

VisionBank AI智能字符识别功能,简单,创造无限可能

针对以上行业发展趋势和客户需求洞察,维视智造技术研发团队于近期成功迭代了维视VisionBank AI通用智能视觉开发平台中的OCR功能,上线【深度通用字符识别模块】。该模块在VisionBank AI的高效架构之上,延续了操作简单的图形化开发方式,基于深度学习算法的技术加持,将为用户带来更智能、更便捷的使用体验:

无需调整参数

在字符识别过程中,当字体的分割参数和图像不匹配时,将无法呈现良好的识别效果,通常的解决方法就是进行调参,反复测试直至效果达到最佳。VisionBank AI此次上线的深度通用字符识别功能模块,可实现智能参数自适应,免去了耗时耗力的调参工作;

无需登录字体库

传统的算法识别,需要登录每个字符的模型,以保证字符的准确识别,VisionBank AI的深度通用字符识别功能模块则可轻松免去这一步操作;

无需深度学习训练

对于复杂的场景,使用深度学习字符识别时,往往需要大量的字符样本训练。而VisionBank AI的深度通用字符识别的强大技术能力,只需拖拉一个模块即可实现字符的直接识别;

多字符类型识别

VisionBank AI深度通用字符识别功能模块目前已可对数字、字母(大小写)、符号、汉字、日语等多种字符类型完成一步识别;

全场景兼容

该功能模块可满足几乎全场景的使用,兼容各种复杂的应用场景,可对快消、零售、医药、机械制造等所有行业中涉及包装编码检测的场景提质增效。

部分应用案例

微信图片_20221124165813.png

微信图片_20221124165816.png