MIT黑科技！这个即将发布的导航技术竟然超越SLAM！--机器视觉网

在不远的将来，机器人可能会作为最后一英里的运输工具被派往你家门口，如果他们能找到门的话，就可以把你的外卖订单、包裹或餐盒订购单放到你家门口。

　　机器人导航的标准方法包括预先绘制一个区域的地图，然后使用算法引导机器人朝向地图上的特定目标或GPS坐标。虽然这种方法对于探索特定环境（如特定建筑的布局或计划的障碍路线）可能是有意义的，但在最后一英里交付的情况下，这种方法可能会变得笨拙。

　　例如，想象一下，公司必须事先绘制机器人传送区域内每个邻居的地图，包括该邻居内每个房子的配置以及每个房子前门的特定坐标，这个任务量会让人崩溃。同样，这样的任务额很难扩展到整个城市，特别是房屋的外观经常随着季节的变化而变化（羡慕国外）。绘制每间房子的地图也可能会遇到安全和隐私问题。

　　新技术

　　现在麻省理工学院的工程师已经开发出一种导航方法，不需要事先绘制一个区域。相反，他们的方法使机器人能够利用环境中的线索规划到目的地的路线，这可以用一般的语义术语来描述，例如“前门”或“车库”，而不是地图上的坐标。例如，如果一个机器人接到指令，要把包裹送到某人的前门，它可能会从马路上开始，看到一条车道，经过训练，它认识到这条车道有可能通向人行道，而人行道又有可能通向前门。

　　这项新技术可以大大减少机器人在识别目标之前探索一处房产的时间，而且它不依赖特定住宅的地图。麻省理工学院机械工程系的研究生迈克尔•埃弗雷特（Michael Everett）说：“我们不想把我们需要去的每一栋建筑都绘制成地图。”有了这项技术，我们希望在任何车道的尽头都能放下一个机器人，让它找到一扇门。”

　　埃弗雷特将在本周的智能机器人和系统国际会议上介绍该技术的成果。这篇论文由麻省理工学院航空航天学教授乔纳森•豪斯（jonathan how）和福特汽车公司（ford motor company）的贾斯汀•米勒（justin miller）共同撰写，是“认知机器人最佳论文”的最终入围者。

　　“对事物的感觉”

　　近年来，研究人员致力于将自然的语义语言引入机器人系统，训练机器人通过语义标签识别物体，这样他们就可以将一扇门视为一扇门，而不仅仅是一个实心的矩形障碍物。

　　埃弗雷特说：“现在我们有能力让机器人实时感知事物的本质。”埃弗雷特、豪斯和米勒正在使用类似的语义技术作为他们的新导航方法的跳板，它利用预先存在的算法从视觉数据中提取特征以生成同一场景的新地图，从而用语义线索或上下文进行分析。

　　在他们的案例中，研究人员使用一种算法来建立机器人移动时的环境地图，使用每个物体的语义标签和深度图像这种算法称为语义SLAM（同时定位和映射）。虽然其他语义算法使机器人能够识别和映射环境中的对象，但它们不允许机器人在导航新环境的同时，在最有效的路径上做出决策，以到达语义目的地，如“前门”，霍华德说：“以前，探索只是把一个机器人扑通一声放下来，对它说‘走’，它会四处移动，虽然最终到达那里，但速度会很慢。”

　　去的代价

　　研究人员希望通过一个语义的、背景色的世界来加速机器人的路径规划。他们开发了一种新的“去代价估计器”，该算法将现有SLAM算法创建的语义映射转换成第二个映射，表示任何给定位置接近目标的可能性。

　　埃弗雷特说：“这是从一个图像到另一个图像的转换中得到的灵感，在这里你拍下一只猫的照片，让它看起来像一只狗。”同样的想法也会在这里发生，以前你把一张看起来像世界地图的图像，可以变成另一张看起来像世界地图的图像，但现在是根据地图上不同点与最终目标的距离来着色的。”

　　这个成本地图是彩色的，用灰度表示，把较暗的区域表示为远离目标的位置，把较亮的区域表示为接近目标的区域。例如，在语义地图中用黄色编码的人行道，可能会被cost-to-go算法转换为新地图中较暗的区域，而车道在接近前门时会逐渐变亮，这是新地图中最亮的区域。

　　研究人员在Bing地图的卫星图像上训练了这种新算法，这些图像包含来自一个城市和三个郊区的77栋房屋。该系统将语义映射转换为代价映射，并按照映射中较轻的区域映射出最有效的路径，以达到最终目标对于每个卫星图像，埃弗雷特都为典型前院的上下文特征指定语义标签和颜色，例如灰色表示前门，蓝色表示车道，绿色表示树篱。

　　在这个训练过程中，研究小组还对每幅图像应用了蒙版，以模拟机器人的相机在穿越院子时可能拥有的部分视图。“我们方法的一部分诀窍是（给系统）提供许多部分图像，”How解释道。所以它必须弄清楚这些东西是如何相互关联的，这正是这项工作得以稳健开展的部分原因。”

　　然后，研究人员在训练数据集之外的一所全新房屋的图像模拟中测试了他们的方法，首先使用预先存在的SLAM算法生成语义图，然后使用其新的成本估算器生成第二张地图和通往目标的路径（在这种情况下为前门）。

　　对比传统的导航算法，该集团的“去发现前车门”新技术更高效与低成本，这种算法比不考虑上下文或语义的经典导航算法快189%，以往的方法花费了过多的步骤来探索不太可能接近目标的领域。埃弗雷特说，研究结果说明了机器人是如何利用上下文来有效地定位目标，即使是在不熟悉的、未映射的环境中。

　　埃弗雷特说：“即使一个机器人正在把一个包裹送到一个它从未去过的环境中，也可能会有一些线索和它看到的其他地方一样。”所以，即便世界的布局可能有点不同，但必然可能有一些共同点。”我们要做的只是让机器人发现和使用这些共通点！