视觉导航，只是便宜还远远不够--机器视觉网

作为低端扫地机器人的标配，便宜成了视觉导航的最大卖点。

便宜≠弥补缺陷

得益于视觉传感器的低成本特性，视觉导航方案的整体成本一直低于激光导航方案，加之在智能化开发方面的巨大潜力，让它迅速成为了目前最主流的导航方案之一，甚至业内普遍认为视觉导航或许将会取代激光导航。不过现实很骨感，想要实现这一愿望，仅靠便宜还远远不够。

到目前为止，视觉导航只是作为低端机的标配，排除厂家产品策略的影响，视觉导航不好用是根本原因。在实际表现中暴露出的不稳定、精度低、易受环境光线影响等缺陷，给人留下了一个不靠谱的印象。

从技术发展来看，由于视觉导航技术起步相对较晚，在理论、技术和产品落地方面都落后于激光导航技术，加之视觉开发的高门槛特性，造就了视觉方案的稀缺性和发展滞后性。不过随着近几年，越来越多的企业投入到视觉行列，视觉技术的发展正在突飞猛进，不乏有不弱于激光导航表现的视觉方案出现，如INDEMIND推出的「家用机器人AI Kit」视觉导航方案。

提升视觉表现，需要系统性方案

「家用机器人AI Kit」是以INDEMIND自研的INDEMIND OS Lite家用机器人AGI系统为核心，搭配面向家用小型机器人专门研发的一体化立体视觉模组，可实现家用机器人导航定位、智能避障、路径规划、决策交互等核心功能，是包含软硬件的ALL IN ONE解决方案。

从2021年推出至今，INDEMIND基于视觉技术路线，不断开发完善，「家用机器人AI Kit」在经过近百次迭代后，在定位精度、鲁棒性等方面取得了跨代式进步。

从视觉导航缺陷的底层原因出发，精度问题、稳定性问题等，本质是一个系统性问题，单纯的针对一个问题，只是治标不治本，想要根本解决，需要从全局架构出发。影响视觉导航精度和稳定性的因素无外乎是算力、光线、算法成熟度，因此INDEMIND设计了一个开拓性的轻量化平台，在不增加软硬件成本的情况下，保障性能的同时，完成了从算法到硬件的集体“瘦身”。

微信图片_20240314145542.jpg

平台包括轻量化VSLAM（基于深度学习特征的SLAM架构）、轻量化Depth（基于深度学习特征匹配的Depth）、轻量化深度学习模型（底层算子自研、剪枝、量化）等，同时还在硬件上，对于视觉处理采用NEON加速、GPU加速、DSP加速等方式，提升计算性能，显著降低了算力要求，在测试中，已能够在几美金的计算平台上稳定运行整套VSLAM算法。

目前，「家用机器人AI Kit」搭载4核A53/A55级别芯片即可满足需求，能够适配如RK3566（全解决方案情况下，双目视觉多传感器融合SLAM、双目Depth、物体识别及整机完整SDK）。需要提到的是，现有的大部分视觉导航方案在算力上大多需要TX2及以上，甚至PC级算力需求，且对CPU、GPU或NPU、内存均有较高要求。为了应对光线适应问题，INDEMIND开发了一套系统化环境补光策略，包含主动式环境补光配置和光照变化条件下的建图策略。

在实际表现中，面对强光直射、无光源、昏暗等特殊光照环境均能无差异工作，且机器人导航精度已能实现绝对定位精度<1%，姿态精度<1°，足以媲美激光雷达，此外与激光导航或激光融合导航不同的是，INDEMIND还首创了真全屋三维建图，接近1:1还原的真实感。

微信图片_20240314145909.jpg

事实上，想要替代激光导航及激光融合方案，做到这些仍然不够，真正的“赢点”，而是智能化，是智能识别、智能地图、智能避障、智能交互等多种关键功能的实现。为此，INDEMIND用多年时间，专门开发了一套智能决策引擎。

微信图片_20240314145913.png

基于高精度三维建图能使机器人在语义层次上理解环境信息，模仿人类大脑对环境理解的方式，并进行策略处理。配合INDEMIND的AI识别技术，机器人可以识别物体、人、动物及空间语义，因此，在避障上，机器人可做出类人规避动作的精细化操作，能够让机器人有策略的实现智能避障(如根据障碍物不同做出不同规避距离)。在交互上，可通过语音、手势、动作等自然语言指令，命令机器人进行安全、搜寻、跟随、自主寻路、定向清扫等多种智能逻辑。以定向清扫为例，发布语音命令:“清扫一下厨房”可被识别为针对地图上识别到的厨房区域进行一次规划清扫。

（文章来源于INDEMIND，如有侵权，请联系删文）