题名基于三维语义地图的室内外大场景视觉定位研究
作者时天欣
答辩日期2020-05
文献子类硕士
授予单位中国科学院大学
授予地点中国科学院自动化研究所
导师申抒含
关键词视觉定位,图像检索,语义分割,学习特征,位姿估计
学位名称工学硕士
学位专业模式识别与智能系统
英文摘要
    视觉定位是计算机视觉领域中一项十分关键的技术,其在三维重建、同步定位与地图构建、增强现实、无人驾驶等领域均有广泛应用。本文针对室内外大场景视觉定位问题进行了系统研究,特别是对提高视觉定位的精确性、鲁棒性以及实际应用性问题开展了相关工作,主要研究内容和贡献如下:
    (1).针对传统定位方法在面对环境变化时检索图像正确率较低的问题,提出了一种利用语义信息筛选检索图像的定位方法。主要贡献为:为普通稀疏三维模型中每一个三维点赋予语义标签,并根据语义类别去除不利于定位任务的三维点;将带有语义标签的三维点投影到语义分割后的查询图像上,统计语义一致的三维点数量,并作为检索图像的语义一致性得分;根据语义得分,为2D-3D匹配赋予权重,并将其用于RANSAC(RANdom SAmple Consensus)过程中被抽选的概率,以便能够有效筛选出正确检索图像产生的匹配,并用于最终的计算。在大时间跨度视觉定位评测数据集上的实验表明,本方法整体定位精度均要高于主流方法。       
    (2).在上述方法基础之上,针对传统手工设计特征面对室内外环境变化不稳定的缺点,提出了利用稠密语义点云以及混合特征的定位方法。主要贡献为:对当前主流的基于深度学习的特征进行了系统性评测,总结定位性能并给出使用建议;提出联合使用学习特征和手工设计特征使其能够在不同环境下发挥出各自的优势,进而能够同时提高在不同环境下的定位精度;提出使用稠密语义三维模型,该模型不仅能够适配所有类型的特征,而且能够有更多的三维点参与投影,从而提高了语义一致性得分的区分度。在大时间跨度视觉定位评测数据集上的实验表明,本方法定位性能均要优于当前主流定位方法。    
    (3).从视觉定位落地应用角度出发,综合当前云端计算能力以及定位方法的时间消耗,提出了适合实际应用的快速定位方法。主要贡献为:为室内以及室外定位任务分别选择了最为合适的图像检索方法;通过对算法复杂度和计算效率的平衡设计,在保证图像检索精度的前提下,提高了图像检索的计算效率;通过系统性实验,提出了利用位置聚类以及根据内点率筛选的定位策略。在三个实际视觉定位落地应用场景的测试表明,本方法能够满足当前实际定位应用对于定位精度以及计算效率的要求。
语种中文
页码90
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/39138]  
专题自动化研究所_模式识别国家重点实验室_机器人视觉团队
推荐引用方式
GB/T 7714
时天欣. 基于三维语义地图的室内外大场景视觉定位研究[D]. 中国科学院自动化研究所. 中国科学院大学. 2020.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace