CORC  > 沈阳自动化研究所  > 中国科学院沈阳自动化研究所  > 其他
题名基于深度学习的人体行为检测方法研究
作者高松1,2
答辩日期2020-05-26
授予单位中国科学院沈阳自动化研究所
授予地点沈阳
导师王宏玉
关键词人体行为检测 深度学习 时序行为候选 实时检测 人-物交互
学位名称硕士
其他题名Research on Human Action Detection Method Based on Deep Learning
学位专业机械电子工程
英文摘要近年来,随着安防监控系统的普及,使得基于人体行为检测技术的智能监控系统在人机交互、智慧城市以及养老监护等领域有着广阔的应用前景。同时随着互联网技术的发展和智能终端的普及,网络平台上涌现出大量的有关人体行为的短视频,自动获取并分析其中的语义信息成为亟待解决的问题。鉴于人体行为检测任务巨大的应用前景和经济价值,使其迅速成为计算机视觉社区的研究热点。人体行为检测任务的传统方法需要根据特定行为手工设计特征,工作量巨大且泛化能力不好,因此本文利用深度学习技术对人体行为检测任务展开研究。由于不同的应用场景对行为检测算法的要求也不同,因此本文探讨了三种不同应用场景下的人体行为检测方法。一是基于离线条件下的人体行为检测方法,二是基于实时条件下的人体行为检测方法,三是基于空间交互的人体行为检测方法。本课题的主要工作总结如下:(1)针对离线条件下的人体行为检测方法中的候选生成阶段,提出了一种基于边界敏感网络的时序行为候选生成算法。本文将更深层的卷积神经网络引入到边界敏感网络中的时序评估模块和候选评估模块,能够更好地提取视频的时序特征,并在后处理阶段非极大值抑制算法中设计了新的置信度分数衰减策略,最终得到了高质量的行为候选集合。所提算法在公开的人体行为数据集ActivityNet上取得了75.71%的平均召回率。(2)针对养老监护场景,构建了包含跌倒、下蹲、行走三类行为的数据集,并基于该数据集设计了实时人体行为检测模型MonitorNet网络。该模型首先实时地从视频流中采样16帧图片,然后利用2D卷积网络提取它们的外观特征,最后将这16个特征图按时间顺序送入3D卷积网络提取时序特征并进行行为预测。所提模型在构建的数据集上取得了97.1%的平均准确率,并能够以每秒25帧的速度在带有GeForce GTX 1060显卡的笔记本上实时检测人体行为。(3)基于Faster R-CNN算法以及以实例为中心的注意力网络提出了一种人-物交互行为检测网络。首先利用Faster R-CNN检测出输入图像中的人和物体,两两组合得到若干个人-物对,然后利用交互行为判别网络识别每个人-物对之间的交互行为。本文将3*3卷积引入到以实例为中心的注意力网络,来更好地综合上下文的信息,同时优化了交叉熵损失函数和训练细节。最终所提模型在大型数据集V-COCO上实现了47.06%的平均准确率。此外,本文收集了一些实际监控场景下的数据,所提模型在该数据集上实现了94.98%的平均准确率以及69.85%的平均召回率。
语种中文
产权排序1
页码85页
内容类型学位论文
源URL[http://ir.sia.cn/handle/173321/27137]  
专题沈阳自动化研究所_其他
作者单位1.中国科学院大学
2.中国科学院沈阳自动化研究所;
推荐引用方式
GB/T 7714
高松. 基于深度学习的人体行为检测方法研究[D]. 沈阳. 中国科学院沈阳自动化研究所. 2020.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace