题名基于关键点检测的目标二维姿态估计研究
作者刘勇
答辩日期2021-05-21
文献子类硕士
授予单位中国科学院大学
授予地点中国科学院光电技术研究所
关键词关键点检测 二维姿态估计 高分辨率网络 并联化结构 姿态跟踪
学位名称工学硕士
英文摘要

    基于关键点检测的二维姿态估计是计算机视觉领域极具挑战性的研究问题之一,其致力于对图像中的给定目标进行关键点检测,通过检测得到的关键点之间的联系获得二维姿态估计结果,在行为识别、姿态跟踪等方面具有重要的研究意义与应用价值。近年来,随着深度学习技术发展壮大,尤其卷积神经网络的特征提取模型陆续被提出,促使关键点检测与二维姿态估计算法的性能提升。但其在研究目标与研究方法上仍存在以下问题:第一,现有的研究成果其二维姿态估计目标主要为人体,而缺少对如固定翼飞机等刚体目标的研究;第二,虽然基于卷积神经网络的特征提取性能优于多数传统方法,但网络层数的加深将导致其参数规模与运算时间随之剧增,从而影响模型的部署和二维姿态估计的效率。本文从基于关键点检测的二维姿态估计方法的调研分析、高分辨率特征提取网络结构的轻量化改动以及二维姿态估计研究目标的推广三个方面进行以下研究工作:

    第一,针对关键点检测方法以及人体二维姿态估计方法进行调研,盘点关键点特征表示方法和基于卷积神经网络的算子与网络结构,分别从关键点表示方法与特征提取网络架构两方面对几种典型的人体二维姿态估计方法进行对比分析,介绍相关数据集与测评指标。

    第二,针对高分辨率网络为保持特征图像高分辨率与多阶段级联结构所导致的参数规模与运算量过大和处理速率下降等问题,提出一种并联化HRNet结构改进方案。首先对各阶段感受野进行分析,剔除HRNet-w32结构的冗余级联阶段,并基于U-Net结构进行调整,提出上采样算子配置不同的U型并联化模块,以弥补级联阶段被剔除所造成的特征提取能力衰减。先后在数据集MPII和COCO上进行人体关键点检测实验与人体二维姿态估计实验,从各关键点特征响应、二维姿态估计准确率、算法处理速率以及可视化姿态图像结果等方面进行分析,最优结构改进方案在保持HRNet-w32结构对关键点检测的高准确率的同时,网络参数规模降低至原先的38.5%,对人体二维姿态估计的处理速率较改进前提高45.5%,有效改善了HRNet结构因参数量过大而导致的特征提取耗时等情况。

    第三,针对如固定翼飞机的给定刚体目标在关键点检测与二维姿态估计研究方面资源有限的问题,参考COCO人体姿态数据集,创建固定翼飞机的关键点 标注数据集并制定相应的标注基准,设计出针对给定刚体目标的二维姿态估计方法。为提升关键点检测流程的处理速率,基于并联化HRNet结构改进方案进行轻量化结构改进,基于所设计的刚体目标关键点检测与二维姿态估计方法,提出二维姿态跟踪方案。在固定翼飞机数据集上进行网络训练以及二维姿态估计的性能测试,并在此基础上实现对视频中固定翼飞机目标的二维姿态跟踪。结果表明固定翼飞机的二维姿态估计准确率mAP较改进前降低0.1%,处理速率较改进前提高50.0%,实现了对视频中固定翼飞机刚体目标的良好可视化二维姿态跟踪。

    最后,本文对主要研究工作以及研究创新点进行整理总结,并对基于关键点的二维姿态估计研究的发展趋势进行展望。

语种中文
内容类型学位论文
源URL[http://ir.ioe.ac.cn/handle/181551/10176]  
专题光电技术研究所_光电技术研究所博硕士论文
推荐引用方式
GB/T 7714
刘勇. 基于关键点检测的目标二维姿态估计研究[D]. 中国科学院光电技术研究所. 中国科学院大学. 2021.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace