日期
08/04
2023
咨询
  • QQ扫一扫

  • Vision小助手
    (CMVU)

机器视觉:从专用向通用、易用迈进的趋势
收藏
2023-08-04 15:30:40来源: 中国机器视觉网

机器视觉作为人工智能(AI)领域的一个重要分支,已在制造业领域取得了广泛的应用。近年来,机器视觉在新能源、半导体、汽车和消费电子等行业中得到了广泛应用,并在缺陷检测、拆码垛、视觉分拣、工业上下料、物流检测等领域取得了巨大成功。这些视觉应用极大地提升了各行业的生产效率和质量水平。机器视觉的初期发展主要集中在模式识别和图像处理上,其算法主要基于人工设计的特征和规则。然而,随着深度学习技术的崛起,机器视觉领域得到了快速发展。基于深度学习的AI模型,如深度神经网络,在图像分类、目标检测、语义分割等任务上取得了重大突破,极大地丰富了机器视觉在工业制造中的应用场景。

然而,目前主导机器视觉领域的模型仍然面向特定任务设计,其泛化能力往往难以支持更广泛场景的部署。特别是在高度碎片化的工业制造领域,这个问题更加突出。举例来说,汽车生产装配过程涵盖了冲压、焊装、涂装和总装等多个工艺环节,每条生产线上的质量控制点数以千计。由于不同细分领域在加工材料、生产流程、工艺要求和环境条件等方面存在差异,机器视觉模型的泛化能力往往难以胜任。此外,当前的机器视觉模型对大量标注数据的依赖性也是一个挑战,因为在实际应用中获取和标注大量数据通常是困难且昂贵的。因此,降低AI模型对数据的依赖性,提高小样本学习能力成为亟需解决的问题。另外,AI模型的开发通常需要专业工程师进行大量的试错和调优,然而,AI模型的黑盒特性使得非专业工程师难以掌握其中的技巧(Trick)。

近年来,以GPT为代表的大模型(基础模型)迅速发展。ChatGPT的热度和其展示的通用人工智能(AGI)能力,表明了大模型在人工智能领域的巨大潜力。有人认为,GPT(Generative Pre-trained Transformer)模型可以成为一种通用技术(General Purpose Technology),而工业制造领域正急需这种技术能力。大模型的迅猛发展不仅本身具备强大的功能,还可以学习使用和制造各种专业工具和插件,几乎变得"全知全能"。大模型展示了多领域、多任务的通用能力,正在克服工业领域中解决方案复制性差、数据量不足等难题,成为一种普遍的生产力基础设施,并以低成本、普及的方式推广到容错率低、成本敏感的产业应用。可以预见,机器视觉将在以下几个方面迎来前所未有的发展机遇:

1.提高泛化能力,降低标注数据要求:大模型的发展使机器视觉基础模型具备更强的泛化能力,能够适应工业制造的各种细分场景,只需少量标注数据即可实现定制化开发,加速视觉模型的量产。

2.强化学习与自适应控制提升:引入强化学习等技术,实现机器视觉模型在实际应用中的自适应控制,提高模型在复杂环境下的鲁棒性和稳定性。

3.构建低代码、无代码的机器视觉应用:大模型引入了一种新型的人机交互方式,即"自然语言编程",降低了模型开发的门槛,使非专业人士也能快速构建机器视觉应用,实现计算平权。

4.多模态学习与通用人工智能融合:通过结合多模态信息,如文本、音频、视频等,机器视觉模型的理解和表示能力得到提升,从视觉感知走向视觉认知,实现更高层次的任务理解和处理能力,为机器视觉领域带来更广泛的应用前景。

机器视觉从专用走向通用、易用是不可避免的趋势。大模型的发展为机器视觉技术带来了新的机遇和突破口,通过提高泛化能力、引入自适应控制、简化开发流程和融合多模态学习,机器视觉有望成为一种通用、易用的技术,推动其从专用到全面应用的转变。这将为制造业等领域带来更高效、智能的生产方式,加速产业升级和创新。