这篇文章对动态SLAM(Simultaneous Localization and Mapping)的多种解决方案进行了深入分析,并确定了解决该问题的最佳方案。文章的重点在于强调了坐标系在解决动态SLAM问题中的重要性。
动态SLAM是指在机器人同时进行自身定位和环境建模的过程中,存在动态物体(例如移动车辆、行人等)的情况。这种情况下,传统的SLAM算法往往会遇到困难,因为传统算法假设环境是静态的,无法处理动态物体。
针对这一问题,文章提出了多种解决方案,包括基于激光雷达扫描数据的方法、基于视觉信息的方法以及结合多传感器的方法。对于每种方法,文章详细分析了其原理、优缺点以及适用场景。
在论述各种解决方案的过程中,文章强调了坐标系对于解决动态SLAM问题的重要性。由于动态物体的存在,机器人在不同时间点获取的传感器数据可能处于不同的坐标系下,因此需要建立准确的坐标变换模型,以保证定位和建图的准确性。
最后,文章总结了各种方法的实验结果,并根据实验数据确定了最佳方案。该方案在处理动态SLAM问题时表现出色,取得了较好的定位和建图效果。
论文地址:https://arxiv.org/pdf/2312.04031.pdf
最新的文献提供了动态SLAM的两种主要表示方法,将动态目标点在世界坐标系或者目标坐标系中表示。尽管在局部参考系中表达目标点可能看上去很直观,但是这可能无法获得最精确、最鲁棒的解决方案。
本文对各种动态SLAM公式进行深入分析,确定解决该问题的最佳方法。基于此目的,本文引入一种使用GTSAM的与前端无关的框架——用于评估各种动态SLAM公式。
最近,已经探索了多目标视觉里程计和基于图优化的动态SLAM系统,以基于静态点和动态点观测结果来联合定位机器人并且估计静态结构和场景中刚体目标的运动/轨迹。这些系统通常采用局部、滑动窗口或者批量优化技术,文献中给出了这些优化问题中表示变量的各种方式。在设计SLAM系统时,选择合适的表示是非常重要的,因为这决定了系统的鲁棒性、精度和效率。因此,对不同表示进行正规分析是至关重要的,这些表示清楚地描述了此类系统成功执行的情况。
局部表达的点可以被建模为相对于目标坐标系的静态点,以增强刚体假设,因此可以由因子图中的单个状态变量来表示。然而,目标坐标系的位姿是无法直接观测的,并且当根据目标的部分观测进行估计时可能是不可靠的。
一种替代方法是在已知的参考坐标系中表达动态点,例如相机坐标系或者地图/世界坐标系。我们先前的工作VDO-SLAM证明了SE(3)运动可以在包含世界坐标系的任何参考坐标系中表达。根据这一点并且通过在世界坐标系中表示动态目标点,避免了估计目标位姿,并且产生了精确的结果。本文将这种表示称为以世界为中心,如图1(b)所示。
本文探索了如何在动态SLAM系统中更好地表示目标。为此,我们引入了一个基于因子图的优化框架,用于开发和测试不同的动态SLAM表示。基于最先进的文献,我们实现了以世界和目标为中心的表示,严格分析了由此产生的SLAM系统的精度和鲁棒性。基于这一分析,本文提出了动态SLAM表示,其最精确且最鲁棒地估计相机位姿和目标运动。
3.1 参考坐标系和符号
本文中讨论的特定表示涉及运动中的机器人,其配备了RGB-D相机,用于观测和跟踪环境中的静态和动态点。
3.2 位姿变换和坐标系变化
公式(4)描述了位姿变换的坐标系变化,它将目标(或机体)坐标系中的运动与世界(惯性)参考坐标系中的运动相联系。使用世界参考坐标系可以通过无模型的方式描述目标运动,从而无需在表示中考虑目标位姿。基于公式(2)和(3),我们可以得到描述世界坐标系中目标运动的运动学模型,如下所示:
4.1 SLAM前端
本文主要研究基于因子图的动态SLAM优化(例如后端或者局部批量处理)。前端和后端之间的接口是串行的,因此可以很容易地替换前端。
前端期望能够提供所有(静态和动态)3D点的逐帧跟踪,并且能够通过相应的目标来关联/聚类动态点。此外,它还可以提供用于跟踪静态点和动态点的相机位姿和目标运动的初始估计值。
4.2 以世界为中心的表示
以世界为中心的表示联合估计相机位姿、目标运动、静态和动态点,所有这些都在世界坐标系中表示。
4.3 以目标为中心的表示
以目标为中心的方法估计世界坐标系中的相机位姿、静态点、目标运动和位姿。对应的因子图如图3所示,其中我们强调了用于实验的公式的不同变体。
其中,图(a)展示了原始以目标为中心的结构,图(b)是其变体,修改了图结构以包含目标运动学因子,而图?保留了该因子,并且移除了以目标为中心的运动因子。为了确保与以世界为中心表示进行公平比较,我们尽可能保留共同的因子,即静态点的点测量因子和里程计因子,如图2和图3之间的相同连接所示。
4.4 目标运动学因子
我们提出加入额外的因子来建模连续目标位姿之间的运动学关系:
我们将它称为目标运动学因子,如图3(b)和3?中的绿色方块所示。
本文对动态SLAM的多种解决方案进行了全面分析,并在现有现实世界数据集上评估了所提出的表示方法。为此,我们使用GTSAM开发了一个与前端无关的优化框架,可以轻松实现和测试不同的配置。根据动态目标及其对应点观测在因子图中的表示方式,这些表示方法可以分为以目标为中心和以世界为中心两种。以目标为中表示方法更直观,因为基于刚体假设,目标点相对于目标局部坐标系是静态的。然而,本文的分析表明,以世界为中心的表示方法可以产生更精确的目标运动估计,在相机位姿估计方面也表现更好,并且在优化过程中展现更好的稳定性。未来,我们计划对研究成果进行正式描述,并提供明确的指导方案。