题名面向开放场景行人重识别的特征表示研究
作者王贯安
答辩日期2021-05-26
文献子类博士
授予单位中科院自动化研究所
授予地点中科院自动化研究所
导师侯增广
关键词开放场景,行人重识别,机器视觉,深度学习
学位专业控制理论与控制工程
英文摘要

随着人们对于社会安全要求的提高,安防已经成为百姓生活密切相关的产业,其中视频监控起着举足轻重的作用。得益于半导体、通信、传感器等关键技术的迅猛发展,视频监控已经大量应用于生产生活中。依靠传统的人力分析处理视频数据越来越困难,安防系统对监控视频处理的速度和精度提出了更高的要求。使用人工智能技术对监控视频数据进行自动、精准、高效地分析和处理的需求十分迫切。在上述背景下,行人重识别应运而生。其任务是,给定一张行人图像,返回该行人在其他监控视频中的图像。基于返回结果,描述出行人的连续运动轨迹,为下游任务(如嫌犯追逃、走失儿童找回等)提供必要信息。

近年来,学者对行人重识别展开了大量的研究,并取得了显著的进展。但目前大部分算法均基于以下假设:(1)训练阶段有充足的标注数据;(2)所有行人均由可见光相机观测;(3)测试阶段时间和空间复杂度不受限制。本文称满足以上假设的行人重识别场景为封闭场景。显然,随着时间的推移,上述假设无法完全满足现有安防系统的要求。为此,本文将上述三个假设做了放松,即:(1)为了满足快速部署的需求,训练阶段标注数据可能不充足。(2)为了满足24小时监控需求,同一个行人可能由可见光与红外光两种相机观测。(3)为了满足低成本部署需求,算法的时间和空间复杂度应尽可能低。本文称满足上述假设的行人重识别场景为开放场景,开放场景导致了三个难点:数据稀缺性、多模态歧义性、以及时空复杂性。针对以上难点,本文分别提出了基于颜色引导的弱监督行人图像数据增广算法,基于图像风格迁移和特征解耦的跨模态对齐算法,和基于半监督特征量化和层级检索策略的时空压缩算法。主要贡献如下:

(1)基于颜色引导的弱监行人督图像数据增广算法。针对行人图像数据稀缺性问题,本文提出了基于颜色引导的弱监督行人图像数据增广算法。该算法包含两个部分:颜色转换生成式对抗网络和颜色敏感行人重识别模型。首先,颜色转换生成式对抗网络基于行人图像数据以及身份/属性等图像级别(非像素级别)的弱标注信息,通过循环重建损失、颜色分类损失以及对抗学习策略,实现对行人衣服区域准确定位、颜色识别及稳定转换。其次,颜色敏感行人重识别模型通过软标签分类损失和颜色敏感度量损失,充分使用增广数据。实验结果表明,该增广方法与已有的数据增广方法良好兼容且互补,多个数据集均有显著提升。

(2)基于图像风格迁移和特征解耦的跨模态对齐算法。针对行人可见光图像和红外光图像的多模态歧义性问题,本文提出了基于图像风格迁移和特征解耦的跨模态对齐算法。首先,为了缓解图像空间模态歧义性问题,该算法设计了对齐生成对抗网络。其以非配对数据作为训练集,循环一致性损失和身份一致性损失做监督,将可见光图像映射为红外风格,可以大幅提升精度。第二,为了缓解特征空间模态歧义性问题,该算法设计了联合集合层面和实例层面的特征对齐策略。该策略采用交换生成和循环一致的自监督策略,稳定地将图像解耦到身份相关和模态相关的空间。在身份空间,两个模态的特征被明确对齐。基于该方法,检索精度可以进一步提升。

(3)基于半监督特征量化和层级检索策略的时空压缩算法。针对行人重识别的时空复杂性问题,本文提出了基于半监督特征量化和层级检索策略的时空压缩算法。第一,该算法采用哈希技术将实值特征量化成二值编码,实现64倍存储空间压缩和5倍检索速度提升,但会导致明显的精度降低。第二,为了缓解精度损失,该算法设计了基于半监督哈希的对抗二值相互学习模型。其采用判别哈希模型学习标注数据,生成哈希模型学习无标注数据,对抗学习策略将生成哈希模型知识迁移到判别哈希模型。通过加入少量的无标注数据,可以有效提高精度。第三,为了进一步提高检索速度,该算法设计了层级搜索策略,通过多合一编码学习网络和自适应阈值优化算法,有效地混合长短编码检索。该策略进一步对检索过程进行加速。

语种中文
页码152
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/48055]  
专题自动化研究所_复杂系统管理与控制国家重点实验室_先进机器人控制团队
推荐引用方式
GB/T 7714
王贯安. 面向开放场景行人重识别的特征表示研究[D]. 中科院自动化研究所. 中科院自动化研究所. 2021.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace