日期
04/26
2023
咨询
  • QQ扫一扫

  • Vision小助手
    (CMVU)

动力锂电池全生产流程缺陷检测方案,部署了多种不同的深度学习和机器学习算法模型
收藏
2023-04-26 16:24:07来源: 中国机器视觉网

挑战

该方案来自某全球领先的锂电池研发和制造企业。面对不断增加的市场需求,该企业积极引入了智能制造技术,对多种锂电池的各个生产环节进行调控与优化,提高生产效率,在保持优异品质的同时突破产能瓶颈。以该企业的核心产品之一——动力锂电池为例。动力锂电池的基本单元是电芯。每一个完备电芯的生产都必须经过极其严格的褶皱、暗斑、掉料以及绝缘膜异常等瑕疵的缺陷检测,以保证最终产品的可靠性与安全性。但在大规模产线上,如果采用人工检测等传统方式来执行毫米级的缺陷检测,不仅速度慢、耗时巨大,精细和准确度更是无从谈起。即便引入基于工业相机的计算机图像辅助检测等自动化方法,也存在缺乏扩展性和灵活性等问题,无法有效应对新产品导致的新瑕疵形式的检测,限制了产能。

解决方案

为有效应对以上问题,这家企业在英特尔的支持下,利用AI 方法构建全新的动力电池缺陷检测方案。通过对产能需求的评估,该企业希望新方案能够达到单条产线 423FPS(Frame Per Second,帧率)的检测速度,同时检测准确率达到 1DPPM(Defect Part Per Million,每百万的缺陷数量)。

新方案一方面根据动力电池产线的实际部署情况,以基于英特尔 ® 架构的平台为基础,构建云(总部云数据中心)-边(边缘计算节点)- 端(产线工控机、工业相机)的架构,并引入英特尔 ® 至强 ® 可扩展处理器、Analytics Zoo 和 OpenVINO ™工具套件,以及面向英特尔® 架构优化的 PyTorch 等软硬件,形成端到端的机器视觉缺陷检测方案;另一方面,根据检测场景的差异,方案中也部署了多种不同的深度学习和机器学习算法模型,让检测速度和准确率均获得了显著提升。

一、“云 - 边 - 端” 协同,构建基于机器视觉的缺陷检测平台

为构建高性能的缺陷检测平台,双方首先从基础架构入手,根据总部云数据中心、各产线的生产管理系统、各类检测设备在缺陷检测流程中的不同作用,以及所处的不同场景带来的特定需求,设计出 “云 - 边 - 端” 协同的方案。

“云” 端的总部数据中心,可以利用强大的计算能力和来自各产线的丰富数据,根据生产场景需要进行集中化的模型训练,再将训练好的模型发布给 “边缘” 和 “端” 侧。

“边缘” 计算节点部署在分厂或产线服务器中,主要包括推理服务器、模型管理器以及模型仓库等组件,用于较重模型的推理,并将推理结果推送至产线质量控制系统中。

“端” 则位于工厂内每条生产线上,主要执行图像采集、预处理、预分类及轻量级推理工作。

微信图片_20230426162529.jpg

工业视觉平台系统架构图

这一架构经部署后对提升缺陷检测效率效果显著。如上图所示,首先,方案采用了分层推理的方案。从前文可知,无论哪种目标检测算法,都会耗费庞大的算力和带宽(用于数据传输)资源;且离产线越远,检测时延就越高。在新方案中,端侧系统采用开源的 OpenCV 计算机视觉库对采集的图像流实施预处理,并将预分类等简单工作负载部署在基于英特尔® 酷睿™ i5/i7 处理器的工业 PC 上,且使用轻量级模型进行推理,将结果直接反馈回产线,应用效率极高。

对于目标检测、图像分割等较 “重” 的工作负载,则通过边缘计算节点完成。这些节点由基于第二代英特尔 ® 至强 ® 可扩展处理器的服务器(集群)构建,可以从云数据中心调取合适的模型和参数,并通过英特尔提供的统一大数据分析及 AI 平台Analytics Zoo 来构建分布式的推理方案。而云端数据中心则主要承担高强度模型训练、推理以及管理职责。除了由基于第二代英特尔 ® 至强 ® 可扩展处理器的服务器构成高性能计算集群外,云端还配备了可扩展的中心存储数据库,存储各类中间过程数据以及最终模型和参数。

经过本地预处理的海量图像流汇集到云端后,方案采用Labelme 标注工具对数据集中的图像进行标注,并将标注后的特征类别及位置信息传输到计算集群中进行训练和推理。

Labelme 工具不仅可以标注各种形状,还具备图像分类、目标检测、场景分割、实例分割、视频标注等功能,可以很好覆盖动力电池缺陷检测的范围。更重要的是,该工具支持像素级的细粒度标注,有助于提升标注效率与准确度。

值得一提的是,云端的算力虽然充沛,但其远离产线,实时性会受到一定影响。新方案在云端引入了面向英特尔 ® 架构优化的 PyTorch 框架,以及 OpenVINO ™ 工具套件来进一步加速推理过程。原生 PyTorch 深度学习框架内置了强大的视觉工具包 torchvision,包含目前流行的数据集、模型结构和常用的图片转换工具,可轻松应对各种图像检测场景。新框架不仅继承了原生 PyTorch 简洁、灵活的特点,还引入面向深度神经网络的英特尔 ® 数学核心函数库(Intel® Math Kernel Library forDeep Neural Networks, 英特尔 ® MKL-DNN),其包含的高度矢量化、线程化的构建模块,能有效提高框架在基于英特尔 ®架构的处理器上的运行速度,配合 OpenVINO ™ 工具套件所提供的模型优化器、指令集优化等功能,令新方案获得了非常好的推理性能。

最后,Analytics Zoo 的引入使 “云 - 边 - 端” 协同架构的运行变得更为顺畅。这一架构将 Spark、PyTorch、OpenVINO ™工具套件以及其它软件和框架,无缝集成到同一管道中,有助于新方案将数据存储、数据处理以及训练推理的流水线整合到统一的基础设施,不仅大幅提升新方案的部署效率、资源利用率和可扩展性,也能减少硬件管理以及系统运维成本。

二、针对不同检测场景,采用适宜检测算法

在这家全球领先的锂电池生产制造企业的动力电池产线中,有三种主要的动力电池缺陷检测场景:绝缘膜间隙检测、正负极偏差检测以及绝缘膜异常问题检测。不同的场景对检测环境、检测速度、检测精度以及检测参数都有不同的要求。通过缜密的技术分析,英特尔帮助该企业针对不同检测场景部署了不同的目标检测模型。

· 绝缘膜间隙检测

绝缘膜是电池充放电时锂离子传输的重要介质,其间隙过大或过小都会影响电池的性能,因此在生产中需要严格把控绝缘膜的间隙范围。但如图所示,绝缘膜的厚度仅为毫米级别,对检测精度要求高。

微信图片_20230426162548.jpg

绝缘膜间隙检测图

英特尔在方案中建议采用 Mask R-CNN 目标检测模型,来实现精细的绝缘膜间隙检测流程。Mask R-CNN 模型是 FasterRCNN 算法模型的一个分支,特点是可对检测目标实施逐像素的分类,进而确定图像中检测目标的类别和位置,并对其进行分割,尤其适合精密检测场景的使用。采用 Mask R-CNN 模型对图片进行像素级分类,分割出检测边缘,再通过 OpenCV测量实现产线所需的 0.3-3.9mm 的测量需求,超过该范围即可确定为缺陷电池。

· 正负极偏差检测

在动力锂电池生产过程中,正极片、绝缘膜、负极片三层材料会叠压在一起进行卷绕,正常的电池正负极需交替出现,且个数一定。如图所示,图片中细长的为阴极,粗的为阳极。如果出现单个极连续出现或者个数不符情况,电池即可被视为存在缺陷,需及时进行自动纠偏调整来控制质量,这对实时性的要求非常高,处理延迟要求在数十毫秒内。

微信图片_20230426162551.jpg

正负极片偏差检测图

英特尔在方案中建议采用轻量级快速目标检测模型——YOLOv3来进行正负极偏差检测。如前文(第14页 “YOLO算法” 部分)所述,YOLO算法模型的主要特点就是检测速度高,而YOLO v3模型作为其轻量级进阶版本,在检测准确率和推理速度上有了进一步的提升,尤其适用于诸如动力电池产线正负极偏差检测所需的实时性和小型目标敏感检测。

· 绝缘膜异常问题检测

绝缘膜异常问题检测主要用于避免动力电池中的绝缘膜异常,导致正负极接触而引发短路事故。如图所示,绝缘膜非常薄,因此该检测对精细度和准确率要求非常高。在经典的深度神经网络中,网络层数越多,能够提取到的图像特征越丰富,也更符合该类检测的需求。但随着网络深度的增加,退化(Degradation)问题也随之产生,即准确率会先上升直至饱和,如果继续增加深度,准确率反而会下降。

微信图片_20230426162554.jpg

绝缘膜破损、丢失、褶皱问题检测实例

ResNet 可有效解决这一问题。其由多个残差块和恒等映射块拼接而成,与一般深度神经网络相比,能有效避免深层网络的梯度消失和退化问题。因此,英特尔在方案中建议采用经典的ResNet50 残差网络实施训练。

三、混合学习方法和迁移学习训练,提升检测效率和准确率

经过产线检测实践发现,通过单一的深度学习方法获得更优的准确率与召回率,需要手工对 logits 进行适当的调整。这无疑给整个检测过程带来了一定的不确定性,并增加了使用难度。为此,英特尔在方案中推荐采用机器学习中的支持向量机(Support Vector Machine, SVM)分类器与 ResNet50 残差网络一起,组成混合模型来实施检测,同样也可以达到类似的优化效果。SVM 分类器能够依据支持向量与分类超平面间隔最大化的原则,通过多次训练迭代,寻求最优的分类超平面来实现数据分类。针对绝缘膜异常检测中的多分类(multiple-class)问题,SVM 能将其分解为多个二分类问题,再构造多个分类器来解决。ResNet50+SVM 的组合方案,不仅很好地解决了绝缘膜破损、丢失、褶皱等异常问题的检测难题,还大幅提升了检测效率和准确率。模型的检测效率和准确度除了与选择合适的模型相关外,还需要有充足的训练数据。一般情况下,要满足实用要求,数据集量级需达到百万级甚至千万级。但在实际产线中,如此高量级的数据集很难收集,且采用大数据集从头训练也需要耗费大量时间及资源。

方案价值

创新的架构以及适宜检测算法的运用,使该企业的电池生产全流程缺陷检测方案一上线,就获得了良好的效果。实际部署后,单条产线的检测速度和准确度都超过了预期指标。

在满足产线所需的检测精度和检测速度之外,新方案在目标检测模型的创新应用上也获得显著效果。以 ResNet50 残差网络和 SVM 分类器的混合模型在绝缘膜异常问题检测场景中的使用效果为例,在验证测试中,先以 1,000 张图片作为样本集,在 ResNet50 模型中进行模型微调得到基准值(97.85% 的准确率和 94% 的召回率),然后在此基础上分别进行参数调整,以及使用 ResNet50+SVM 的混合模型进行训练。验证结果如图 2-1-16 所示,在 ResNet50 模型中进行参数调整优化后,可将准确率提高至 99%,将召回率提高至 97.56%,而加入SVM 分类器后,更是将准确率提升至 99.12%,将召回率提升至 99.16%,检测精度提升显著。

微信图片_20230426162558.jpg

(文章来源于网络,如有侵权,请联系删文)