- 06/24
- 2025
-
QQ扫一扫
-
Vision小助手
(CMVU)
机器人行业被誉为"制造业皇冠顶端的明珠",其研发、制造和应用水平直接体现了一个国家科技创新与高端制造业的综合实力。在工业应用场景中,为机器人配备多模态传感器系统是实现智能化的关键基础。其中,视觉感知技术作为核心感知能力之一,通过相机传感器获取丰富的环境信息,实现空间定位、场景解析及精准识别等,赋予机器人适应复杂工况的能力,已成为全球科技竞争的战略制高点。
以上下料场景为例,当前市面常见的机器人视觉感知解决方案仍为基于3D相机,以“眼在手外/上”的形式驱动相机对目标区域采集图像信息和点云信息,调用视觉识别和目标物的位姿估计等算法,最终实现目标物的抓取。
面对柔性生产,该类型技术方案有几个普遍劣势:新产品导入调试投入较高,尤其是技术人员的调试成本;算法需要定制开发,难以适配多品类生产;毫米级高精度抓取需依赖高相机成像质量,且新品导入引发的硬件适配改造需求,导致升级成本持续推高!
针对当前视觉感知技术瓶颈,微亿智造创新融合具身图像感知与云端大模型等技术,无需人工示教,机器人通过“自看”、“自学”,实现对任务理解、精准定位及云端训练迭代等,显著降低现场新品导入成本,并通过实际项目技术验证,为工业柔性制造提供可复制的技术方案。该技术路线展现出四大核心优势:
小时级学习速度:基于自研的云端大模型,机器人能自主理解和执行需要学习的目标物和环境信息,上传到云端进行学习并现场验证学习结果,再将学习的成果迁移到端侧的小模型上进行任务执行,整个学习时间为小时级,快速且方便。
亚毫米级定位学习误差:在机器人云端学习阶段,定位学习的绝对定位误差能<1mm/1°。在部署到端侧后,可以仅用一张实时图片对物体进行亚毫米级的定位,快速且精准。
视觉算法兼容各类物体:基于学习的视觉算法无需针对物体的几何形状信息做定制化的开发,真正做到对各类型物料的通用化,柔性满足新产品的生产需求。
标准化且低成本:仅通过低成本的2D相机,结合自研的重建和定位学习技术,即可满足柔性生产的任务需求,真正做到标准化且低成本。
物体自主观察目标物进行学习
以“快速、精准、柔性、高性价比”优势,目前该解决方案已用于PCB板的柔性上下料生产项目中,未来微亿智造会有更多的具身智能工业机器人解决方案赋能工业柔性生产。
在项目实际落地过程中,微亿智造团队发现:传统精度评估标准更多的是聚焦相对精度指标,面向实际工业场景中绝对定位精度的评估还停留在实验室阶段。绝对定位精度又恰是具身智能实现工程化落地的核心要素。为此,微亿智造创新构建了首套工程化精度评估体系,为视觉感知精度提供了可量化、可复现、可迭代的新型评价范式。
在三维空间坐标系下,当物体被放置到载物台上,视觉系统对物体进行定位的绝对精度本质上可以描述为视觉系统的预测值与真实值之间的误差。微亿智造以此设计了一套软硬件结合的绝对定位精度评估验证系统,从底层建立可靠的评价体系,并帮助算法迭代。
物体真值获取前标定设置
该系统通过高精度(<0.1mm)的治具板及其标定销孔,结合机器人末端标定的pin针建立坐标关系,使任意姿态放置的物体位姿均可被精确解算,最终实现系统误差小于0.5mm的亚毫米级定位精度评估。
此外,通过仿真环境在绝对精准的环境下,对算法进行评估及迭代,扩充数据的多样性。这种虚实结合的评估验证系统,赋能具身智能工业机器人实现动态场景下的亚毫米级定位精度。
仿真环境数据扩充数据多样性
微亿智造的实践证明,通过具身智能技术突破硬件限制,是推动机器人普及的关键。未来,随着感知技术的持续进化,机器人将不再是工厂流水线的“附属品”,而是能自主思考、灵活协作的“智能伙伴”,这一进程,或许比我们想象的更快到来。