CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 硕士学位论文
题名融合层级目标关系图的开放环境语义目标导航研究
作者许涛
答辩日期2023-05
文献子类硕士
关键词语义目标导航 层级目标关系图 具身智能 经验重放
英文摘要

自主导航是具身智能领域的一个研究重点,它在无人系统自主作业场景中有着重要的应用价值。随着人工智能技术的不断进步,无人系统的环境感知能力正在从智能识别逐步过渡到目标语义理解。目前,基于视觉的语义目标导航技术已经能够使用单目相机作为唯一传感器输入,通过深度学习模型完成端到端的导航动作预测,从而大大降低了无人系统的部署成本。然而,该技术仅使用局部视觉输入作为传感器输入,缺乏全局信息,如地图和GPS等,因此智能体在未知环境中很难快速且精准地完成导航任务。因此,基于视觉的语义目标导航仍然是当前具身智能领域研究的重点和难点。

本文围绕语义目标导航技术中全局信息的缺失问题展开讨论,希望通过图神经网络嵌入与导航相关的先验信息,以弥补全局信息的缺失,从而促进语义目标导航问题的研究,提高语义目标导航任务成功率的同时降低导航系统的部署成本以及实现复杂度。本论文的主要工作和创新点归纳如下:

1. 提出基于类平衡经验重放的开放环境感知算法

基于视觉的语义目标导航任务中,环境感知算法多为利用深度学习模型对第一人称视角的视觉输入进行处理,进而提取丰富的视觉特征表示,以便于后端导航决策模型学习导航策略。针对开放环境下的环境感知算法的灾难性遗忘问题,本文提出了一种基于类平衡经验重放的类增量持续学习算法。该算法将持续学习过程分为两部分:增量学习部分和学习能力提升部分。首先增量学习部分利用K-Means算法选择旧类别数据进行保留,采用类平衡重放策略将新旧类别数据进行混合训练。其次学习能力提升部分引入数据增广、批归一化以及标签平滑等技术对主干网络进行改进,从而提高模型的鲁棒性和泛化性能,减少过拟合。该算法在图像分类任务中得到了充分的实验验证,并推广到目标检测任务中实现。

2. 提出融合层级目标关系图的导航决策算法

面向基于视觉的语义目标导航任务,本文提出了一个端到端导航模型框架,利用AI2-iTHOR具身智能环境进行强化学习训练,完成了语义目标导航任务的端到端实现。在此基础上,本文针对基于单层目标关系图的导航模型推理能力较弱的问题,搭建了一个分层图卷积神经网络。通过图卷积块和图池化块的堆叠,该网络可以用于生成“区域-目标”层级目标关系图,从而使得智能体在语义目标导航任务中推理更为高效,在提高智能体导航成功率的同时减少导航步数,使得智能体能更快更准地到达目标。针对语义目标导航任务中的稀疏奖励函数问题,本文提出一种新的稠密化的奖励函数,通过稠密化奖励信号的同时鼓励智能体在未知环境中探索,指导智能体在室内环境中进行强化学习训练,提升深度强化学习的学习速度和策略水平。针对现有端到端语义目标导航模型中轮次判定不足的问题,本文提出了一种基于拒识机制的结束判定算法,不仅能够提高模型的鲁棒性和准确性,还可以避免无效的导航操作,从而提高导航模型的训练效率。

语种中文
页码78
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/52111]  
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
许涛. 融合层级目标关系图的开放环境语义目标导航研究[D]. 2023.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace