- 01/07
- 2021
-
QQ扫一扫
-
Vision小助手
(CMVU)
波士顿动力公司(Boston Dynamics)的自主四足Spot机器狗,可能是机器人这类发明中知名度最高的一个了。现在,Spot机器狗配备的人工智能软件可以处理数据并分析周边环境,从而让操作人员避开危险环境。
2019年9月,BostonDynamics公司全球发布了其第一款商用机器狗产品Spot(见图1)。这款产品使非学术和非军事用户能够开发出灵活的四足机器狗产品,以满足商业应用需求。尽管早期用户已经成功地在数据采集应用中部署了Spot机器狗,但面临的挑战是:机器狗如何理解信息并将它们转化为可执行的动作信息。
图1:2019年9月,BostonDynamics公司强壮而富有魅力的Spot机器狗,成为公司的第一款商用产品。
“Spot机器狗可以在未知、混乱或对抗性的敌对环境下行动,并能收集不同类型的信息,比如可见的图像、3D激光扫描图或热图。”Boston Dynamics公司业务拓展副总裁MichaelPerry表示,“客户被Spot捕捉现场仪表图像的能力所震撼,但他们很快就提出了新的需求——要求Spot机器狗能将收集到的信息转发给工作系统,这样当现场仪表读数到达某个限定值时,工作系统能触发相关的人工干预程序,以启动相应的检测或维修工作。”
为了使Spot机器狗能够理解其收集到的数据,Boston Dynamics公司启动了一项早期用户计划。BostonDynamics公司率先与视觉软件公司Vinsa达成了合作伙伴关系。两家公司已经协作为Spot机器狗配备了Vinsa软件,并将它们部署到了一些电厂、石油和天然气厂以及一些化工厂中(见图2)。
图2:部署了Vinsa公司人工智能软件的Spot机器狗,可用于电厂、石油和天然气厂、化工厂及核电厂等众多危险场所。
在Vinsa软件工作前,必须先捕获图像。Spot机器狗配备了5台全局快门黑白立体相机——前面两台,身体两侧各一台,尾部一台。其中任何一台立体相机都具有一个结构化投光器,并指向地面,保证机器狗可以获得位置信息,即把脚放在什么地方可以保持稳定,同时也为机器狗提供了避障能力。Spot机器狗能将高度超过30cm的任何物体都视为障碍物,并能避开绕行。
除此之外,Spot机器狗还使用这些相机进行同步定位和地图构建(SLAM),以实现自主导航。在地图构建期间,Spot导航通过一个空间,并创建该空间的3D点云,从而在地图上获取一个路径点。这有助于Spot机器狗知道去哪儿和执行什么动作。将5台立体相机捕获的图像拼接成视频,可以通过一个用户界面访问所有相机。
Spot还有两个DB25端口,它们为机器狗的外部负载提供电源和通信。任何配备了Vinsa软件的机器狗,都具备板载图形处理单元(GPU)用于(计算)推理;同时还会配备一台高分辨率360°全景相机,这对于那些需要捕获高质量可放大图像、并允许软件读取仪器数据的场合,是非常有用的。
Vinsa公司的主要产品线包括预置深度学习模型,主要用于工业检测应用,应用范围从仪表读数(见图3)到检测油/水渗漏等。该公司还具有一款获得专利的软件引擎,称为Alira,它能通过报警系统启动人工干涉来优化计算机视觉模型的性能,以使模型适应各种条件。两种软件都可以部署到Spot机器狗中。
Spot还有两个DB25端口,它们为机器狗的外部负载提供电源和通信。任何配备了Vinsa软件的机器狗,都具备板载图形处理单元(GPU)用于(计算)推理;同时还会配备一台高分辨率360°全景相机,这对于那些需要捕获高质量可放大图像、并允许软件读取仪器数据的场合,是非常有用的。
Vinsa公司的主要产品线包括预置深度学习模型,主要用于工业检测应用,应用范围从仪表读数(见图3)到检测油/水渗漏等。该公司还具有一款获得专利的软件引擎,称为Alira,它能通过报警系统启动人工干涉来优化计算机视觉模型的性能,以使模型适应各种条件。两种软件都可以部署到Spot机器狗中。
图3:Vinsa软件采用了YOLO和Inception等深度学习架构,在能够完成读取仪表数据这样的任务之前,需要对其进行30~45天的训练。
在有十万只仪表的环境中,任何新的状况都可能突然出现。仪表盘上刺眼的反光会使仪表数据无法读取,如果仪表发生了碎裂或变形,又或者机器狗遇到了它以前从未见过的仪表,软件必须对该做什么和如何调整进行抉择。Vinsa Alira引擎应对这些情况的方法是:报警向人工专家求助,以在未来更好地应对这种情况。报警方式则依赖于操作员的喜好,可以选择在人机界面上显示、通过文本信息报警、e-mail报警,或是通过Amazon或Google等平台报警,软件引擎中预置了这些选项。
“这里需要指出的很重要的一点是,在训练期间,有一件事是Vinsa不做的:那就是努力发现所有的极端案例(即只在正常运行参数范围之外才会发生的状况)。”Bruce指出,“生产中可能会遇到很多极端案例,对此有些公司会采取不同的方法,比如花费大量时间训练一个模型去学习所有这些极端案例。”
训练内容包括图像和视频数据,其中视频数据会合成为单独的帧。例如,通过观察一个静态帧,不太可能探测到管道上的一处泄漏点。它可能需要看到一连串的水滴从管道的某个位置流出,这种情况就只能通过视频才能检测到,Bruce解释说。基本的模型训练需要1万到数百万张图像。在根据客户情况对基准进行调整期间,Vinsa通常会寻找2000~3000个客户数据样本,来建立新的基准。
处理可以在三种不同模式下进行:(1)边缘处理模式,这种模式下,所有推理和模型在Spot机器狗的机载GPU上运行;(2)本地机处理,Spot机器狗将数字数据发送回中央处理器处理,并通过特定的通信方式将处理后的信息返回给机器狗;(3)云处理,例如放在Amazon Web Service等虚拟私有云上处理。
波士顿动力公司和Vinsa公司的合作,不仅为客户带来生产效率提升等诸多好处,而且它也使工人远离危险环境,比如派人到核电厂检查、在危险区巡视、以及对石油钻井平台上的高压设备进行处理等。Bruce特别指出,为了对高压设备进行处理,必须要对高压设备降压,并停止操作,以确保工作人员进入工作现场是足够安全的。
“有了这些软件,不仅可以使工人远离危险的工作环境,而且在检测设备期间也不必断电停业,保障了工厂的正常运转,提高了生产力水平和效率。” Bruce总结道。