题名面向多粒度语义目标的人脸图像编辑
作者邓琪瑶
答辩日期2022
文献子类博士
授予单位中国科学院自动化研究所
授予地点中国科学院自动化研究所
导师孙哲南
关键词人脸图像编辑 语义图像合成 人脸属性编辑 生成对抗网络
学位名称工学博士学位
学位专业模式识别与智能系统
英文摘要

人脸图像表征了人的生物特性,一直是计算机视觉和图像处理领域的研究热点。随着移动智能设备的普及和社交媒体的推广,人脸图像编辑已经成为学术界和工业界的热门研究方向。近年来,深度学习技术的提出和迅速发展为人脸图像编辑注入了新的发展动力,在虚拟数字人、社交娱乐、影视制作等领域开创了新的应用形式。人脸图像编辑具有语义目标复杂、表示形式多样等特点,需要根据语义形式设计和构建人脸图像编辑模型。因此,从多种语义目标的角度研究人脸图像编辑具有重要的理论意义和应用价值。本文面向多粒度的语义目标对人脸图像编辑展开研究,以生成对抗网络为研究基础,从粗到细地分析不同粒度语义目标的特点。本文的主要工作和创新性点归纳如下:

1、针对基于类别标签的人脸属性编辑,本文提出了一种可控的高分辨率人脸属性编辑方法。高分辨率图像比低分辨图像包含更多的细粒度纹理和内容信息,对模型参数量和训练稳定性提出了更高的要求。为了编辑高分辨率人脸图像,本文提出从小波域分解人脸图像,并引入了一个小波感知损失重建原始图像,利用小波分解的不同小波系数获取并保留高分辨图像的全局拓扑结构和纹理信息。与图像域的重建损失相比,小波感知损失更好地还原了原始图像的细粒度纹理和高频细节。为了缓解非目标属性不可控问题,本文提出对所有属性(目标属性和非目标属性)施加相同的属性类别约束是导致非目标属性区域变化的重要原因,进而提出利用权重策略对目标和非目标属性的分类损失进行加权。具体地,在训练目标中引入加权二元交叉熵损失,加强对目标属性的类别约束,同时减少对非目标属性的关注。实验表明,在不影响模型规模的情况下,本方法可以对高分辨率(512×512)图像实现准确的人脸属性编辑,在多属性、局部遮挡、连续属性变化等场景中具有良好的鲁棒性。

2、针对基于局部区域的人脸部件编辑,本文提出了一种参考图像引导的人脸部件编辑方法。相比于其他人脸属性,人脸部件(如眼睛、鼻子、嘴)的编辑更加聚焦于形状变化。基于类别标签的人脸属性编辑方法由于其给定的标签信息有限,难以灵活操控人脸部件的形状。为了给人脸部件提供更大的形状变化空间,本文提出了“以合成代替编辑”的研究思路。具体地,该思路以去除目标部件区域的人脸作为输入,通过合成缺失区域内容实现对人脸部件形状的编辑。人脸部件的形状难以用语义标签准确地进行描述,本文提出利用参考图像提供目标人脸部件形状,这种方式更加符合实际应用需求,也为形状风格提供了多样化的选择。为了引导网络学习参考图像的目标信息,在网络中引入了一个示例指导的注意力模块,该模块将参考图像的目标人脸部件特征融入原始图像。为了监督所提出的模型,采用上下文损失来约束生成图像和参考图像之间的形状相似性,同时采用风格损失和感知损失来保持生成图像和原始图像之间的外观纹理一致性。本文提出的“以合成代替编辑”的研究思路走出了人脸图像编辑的常规框架。实验表明,该方法可以根据给定的参考人脸实现多样化、高质量和可控的人脸部件编辑,摆脱了对精确中间表示的依赖。

3、针对基于像素语义的人脸肖像编辑,本文提出了一种语义随机量驱动的人脸肖像编辑方法。当前的人脸肖像编辑与合成方法难以同时实现语义可控性和风格多样性。本文提出将语义信息与随机量相结合,设计了一种语义随机量。语义随机量不仅可以利用其单独采样的特点控制每个语义区域,还可以通过重采样生成多样化的风格,实现了语义可控且风格多样的人脸肖像合成。为了将语义随机量进一步扩展到对真实人脸进行操纵,本文提出了一种三元网络结构,在同一个框架中实现了人脸语义合成和真实人脸编辑两个任务。三元网络结构由生成网络、重建网络和操纵网络组成。其中,生成网络根据语义随机量生成高质量的人脸图像,重建网络用于保留输入图像中不需要编辑的内容,操纵网络将真实人脸特征中需要编辑的语义替换为语义随机量实现了语义操纵。实验结果表明,该方法能够合成高质量、高多样性的人脸图像,准确地编辑人脸的像素语义,并在各项性能评估中取得了良好的结果。

语种中文
页码128
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/48696]  
专题自动化研究所_智能感知与计算研究中心
推荐引用方式
GB/T 7714
邓琪瑶. 面向多粒度语义目标的人脸图像编辑[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 2022.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace