CORC  > 兰州理工大学  > 兰州理工大学
题名视频内容理解研究与应用
作者王涛
答辩日期2019
导师赵宏
关键词视频内容理解 视频关键帧 目标检测 HSV直方图 自动驾驶
学位名称硕士
英文摘要随着互联网的广泛应用和现代信息处理技术的发展,视频数据呈现出爆炸式的增长趋势。由于视频数据具有结构复杂、内容丰富、非结构化等特点,人们对海量视频数据处理能力有限,其中潜在的信息没有被充分挖掘,因此需要采用更加智能化的技术对其进行处理。视频内容理解是智能化处理视频的主要手段,也是计算机视觉领域的一个研究热点和难点,涉及到的学科包括模式识别、图像处理、计算机视觉、人工智能等,在军用、民用及医学等方面有着重要意义,广泛的应用前景和潜在的经济价值。本文主要基于视频关键帧提取和目标检测实现视频内容理解,并通过视频内容理解在自动驾驶中的实际应用为例,阐述视频内容理解技术和应用。本文工作由以下五个部分组成:(1)针对视频数据非结构性、难以处理的特点,利用HSV直方图法将抽象复杂的高维数据转换为可以量化的低维数据,从而减少了数据量。(2)结合视频数据相邻帧具有相似度高的特性,将关键帧提取转换为聚类问题,分别设计了K-Means、凝聚层次聚类和密度峰值聚类算法来提取视频关键帧,并分析了它们的聚类效果,同时对比了压缩域关键帧提取算法和非压缩域关键帧提取算法的结果,最终得到了一种综合性能较好的视频关键帧提取算法。(3)为了保证聚类的质量,利用轮廓系数SC(Silhouette Coefficient)计算最佳聚类簇数,以确定初始的聚类中心和簇的数量。(4)为了提高目标检测模型的准确率,对数据集进行了剪枝,使得模型能够更好地适应特定应用场景,实验表明,改进后的模型在识别准确率上有所提升。(5)结合关键帧提取和目标检测算法构建了一套完整的视频理解实验流程,以自动驾驶系统为背景对实验数据进行了分析,展示了视频内容理解在自动驾驶中的实际应用。
语种中文
页码70
URL标识查看原文
内容类型学位论文
源URL[http://ir.lut.edu.cn/handle/2XXMBERH/95509]  
专题兰州理工大学
作者单位兰州理工大学
推荐引用方式
GB/T 7714
王涛. 视频内容理解研究与应用[D]. 2019.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace