案例中心
您当前的位置 : 首 页 > 案例展示 > 基于视觉SLAM的研究现状

资料下载Download

D

联系我们Contact Us

上海巨视安全防范技术有限公司

电 话:021-64192060

无人机:13311882358(孙总)

交换机:18017588179(孙经理)

邮 箱:service@covond.com

地 址:上海市闵行区中春路4999号

           莘庄商务楼1326室

基于视觉SLAM的研究现状

2025-06-14 11:19:00
39次

与基于激光雷达的方案相比,视觉SLAM具有低成本和易于安装的优点,具有较强的场景识别能力。事实上,人们正试图用相机代替激光雷达传感器,或者在自动驾驶领域中基于相机集成其他传感器。

基于视觉SLAM的研究现状1.png

视觉SLAM系统的经典结构可分为五个部分:相机传感器模块、前端模块、后端模块、回环模块和建图模块。相机传感器模块负责收集图像数据,前端模块负责跟踪两个相邻帧之间的图像特征,以实现初始相机运动估计和局部建图,后端模块负责前端的数值优化和进一步的运动估计,回环模块负责通过计算大规模环境中的图像相似度来消除累积误差,建图模块负责重建周围环境。

视觉传感器主要可分为单目、双目、RGB-D摄像机。

视觉SLAM的前端被称为视觉里程计(VO-Video Odometry):负责基于相邻帧的信息粗略地估计相机运动和特征方向。前端主要可分为两类:基于特征的方法和直接方法。基于特征点的VO系统运行更稳定,对光和动态目标相对不敏感。具有高尺度和良好旋转不变性的特征提取方法可以大大提高VO系统的可靠性和稳定性。ORB方法被认为更适合自动驾驶车辆。

后端接收前端估计的摄像机位姿,并优化初始位姿,以获得全局一致的运动轨迹和环境图。后端算法的类型主要可分为两类:基于滤波器的方法(如扩展卡尔曼滤波器(EKF)Bailey等人,2006)和基于优化的方法(例如因子图Wrobel,2001)。它们的描述如下:基于滤波器的方法,该方法主要使用贝叶斯原理基于先前状态和当前观测数据来估计当前状态(Liu,2019)。典型的基于滤波器的方法包括扩展卡尔曼滤波器(EKF)(Bailey等人,2006)、无迹卡尔曼滤波器(UKF)(Wan和Merwe,2000)和粒子滤波器(PF)(Arnaud等人,2000)。

基于优化的方法,基于非线性优化(图优化)方法的核心思想是将后端优化算法转换为图的形式,以不同时刻的主题位姿和环境特征为顶点,顶点之间的约束关系由边表示(Liang等人,2013)。构建图形后,使用基于优化的算法来求解目标的位姿,以便顶点上要优化的状态更好地满足相应边上的约束。在执行优化算法之后,对应的图是目标运动轨迹和环境图。目前,大多数主流的视觉SLAM系统使用非线性优化方法。

基于视觉SLAM的研究现状2.png

回环

回环的任务是允许系统基于传感器信息识别当前场景,并在返回原始位置时确定该区域已被访问,从而消除SLAM系统的累积误差

对于视觉SLAM,传统的回环检测方法主要使用单词包(BoW)模型(Galvez LoPez和Tardos,2012),实现步骤为:i)通过对从图像中提取的局部特征的K-means聚类,构建包含K个单词的单词列表。ii)根据每个单词的出现次数将图像表示为K维数值向量。iii)判断场景的差异,并识别自动驾驶车辆是否已到达所识别的场景。



建图

自动驾驶汽车的一个基本组成部分是建立环境地图并在地图上定位的能力。建图是视觉SLAM系统的两项任务之一(即定位和建图),它在自动驾驶的导航、避障和环境重建中发挥着重要作用。一般来说,地图的表示可以分为两类:度量地图和拓扑地图。度量地图描述了地图元素之间的相对位置关系,而拓扑地图强调了地图元素间的连接关系。对于经典的SLAM系统,度量地图可以进一步分为稀疏地图和密集地图,稀疏地图仅包含场景中的少量信息,这适合于定位,而密集地图包含更多信息,这有利于车辆根据地图执行导航任务。

 基于视觉SLAM的研究现状3.jpg

基于一维激光雷达测距仪的单目视觉SLAM方法,该方法在低成本硬件上实现了有效的漂移校正,并用于解决单目SLAM中经常出现的尺度漂移问题。


多传感器融合方法(如视觉-LIDAR-IMU融合SLAM)被认为适用于L3级别的自动驾驶,并引起了许多学者的关注。基于激光雷达的SLAM系统可以获得广泛的环境细节,但在缺乏结构信息的场景(尤其是自动驾驶场景)中很容易失败。例如,长长的走廊或开阔的广场。基于视觉的方法在具有丰富纹理信息的场景中表现良好,并且很容易重新识别场景(Shin等人,2020)。但它对照明、快速移动和初始化过程的变化非常敏感。因此,激光雷达和视觉传感器经常与IMU融合,以提高系统的准确性和鲁棒性。IMU可以消除点云的运动失真,并在缺乏特征的环境中持续一段时间,同时可以帮助视觉系统恢复尺度信息。

基于视觉SLAM的研究现状4.png

 


标签

image.png     微信二维码.jpg

           公众号                              扫码咨询

联系我们
上海市闵行区中春路4999号莘庄商务楼1326室
service@covond.com
www.covond.com

交换机:18017588179(孙经理)   

无人机:13311882358(孙总)

底部导航

首页                    高精度定位

工业物联网          智能设备箱

工业交换机          案例中心   

新闻中心  

Copyright © 上海巨视安全防范技术有限公司 主要从事于徐州uwb定位,徐州高精度室内定位,徐州工业通讯网关, 欢迎来电咨询! 沪ICP备18000433号