CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 硕士学位论文
题名面向平面场景的单目视觉SLAM研究
作者杜思聪
答辩日期2021-05-26
文献子类硕士
授予单位中国科学院自动化研究所
授予地点中国科学院自动化研究所
导师王飞跃
关键词视觉SLAM,SLAM初始化,平面实例分割,滑动窗口
学位专业控制工程
英文摘要

       视觉同步定位与地图构建 (Simultaneous Localization and Mapping, SLAM) 是三维计算机视觉领域的核心问题,也是移动机器人、增强现实等领域的关键技术。视觉 SLAM 通过分析输入的图像信息,在相机运动的同时估计相机轨迹并构建环境地图。近年来单目视觉 SLAM 因成本低廉、使用便捷受到了业界的广泛关注。单目视觉 SLAM 通过初始化过程计算初始时刻的相机位姿和场景结构,为后续的 SLAM 系统运行提供初值。初始化质量决定了单目视觉 SLAM 的性能。

       在单目视觉 SLAM 运行的实际场景中,平面是一类常见且重要的特征结构。
根据相机观测到平面个数的不同,本文将平面场景分为单平面和多平面两类。单平面场景是指相机视野中只包含一个平面,而多平面场景是指相机视野中存在多个平面结构。现有单目视觉 SLAM 方法在平面场景下没有充分使用平面约束,存在初始化速度较慢、鲁棒性差、依赖相机运动模式等问题。针对以上问题,本文对平面场景下的单目视觉 SLAM 技术展开了深入的研究,具体工作如下:

       1. 针对单平面场景,本文提出了全局平面优化的方法完成单目视觉 SLAM 初始化任务。该方法首先根据连续的多帧信息计算出每两帧之间的单应性矩阵,然后通过全局平面优化的方法对相机位姿和平面法向进行求解。全局平面优化的目标是最小化基于单应矩阵的投影误差,优化变量为相机位姿和平面法向。 最后再利用平面方程和相机投影方程完成地图点重建。相比于已有方案,全局平面优化方法避开了单应矩阵分解、三角化等容易受到噪声扰动的过程,并且
大大减小了系统优化变量的数量。实验表明,该方法收敛速度快,能够准确地计算出相机位姿和地图点。

        2. 针对多平面场景,本文在全局平面优化的基础上引入了平面实例分割方法,完成了单目视觉 SLAM 初始化任务。该平面实例分割方法通过深度神经网络实现,其输入是单张图片。神经网络通过编码器将图片上的所有像素点映射到高维嵌入空间中,并且使位于相同平面上的像素点在该空间中尽可能靠近,然后在此空间中使用聚类完成对平面像素点的划分。为了加快推断速度,本文在神经网络训练过程中使用了细粒度剪枝使模型参数更加稀疏。在平面实例分割结果的基础上,本文对包含像素点数量最多的平面进行特征点检测与跟踪,并根据特征点的对应关系计算帧间单应矩阵。在此基础上使用全局平面优化方法求解相机位姿和平面法向,最后使用平面方程和相机投影方程完成地图点求解。实验表明,该方法能够比较准确地完成平面实例分割,并提高了多平面场景下单目视觉 SLAM 的初始化精度。

       3. 本文构建了一套基于滑动窗口优化的单目视觉 SLAM 系统。该系统在完成初始化任务的基础上,使用滑动窗口完成在跟踪过程中对相机位姿的持续计算和地图点的重建。滑动窗口序列维持先进先出机制,当有新的图像加入该序列时,最早加入该滑动窗口的图像信息会被移出。本文通过优化的方法计算新加入图像对应的相机位姿和地图点。整个滑动窗口在 SLAM 系统运行过程中只保存数量较少的图像信息,从而达到计算精度和计算效率之间的平衡。

语种中文
页码98
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/44693]  
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
杜思聪. 面向平面场景的单目视觉SLAM研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 2021.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace