CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 博士学位论文
题名面向微创手术的内窥镜影像关键区域分割方法研究
作者倪振梁
答辩日期2022-05-26
文献子类博士
授予单位中国科学院自动化研究所
授予地点中国科学院自动化研究所
导师侯增广
关键词内窥镜,图像分割,自蒸馏算法
学位专业控制理论与控制工程
英文摘要

微创手术具有创口小、感染率低、术后恢复快等优点,具有广阔的发展前景。目前,微创手术机器人被广泛地应用于微创手术中。微创手术机器人显著地改善了医生的工作环境,提升了手术的安全性。但是,机器人的应用增加了医生的学习成本。微创手术机器人导航系统的开发有助于减少医生的学习周期,提升手术的安全性。微创手术机器人导航的核心难点在于机器人需要拥有像手术医生般的视觉感知能力。具体来说,微创手术机器人需要能够从内窥镜图像中获取关键物体的位置信息。语义分割方法可以帮助机器人识别并定位物体的边界。因此,本文针对内窥镜图像中的关键区域分割问题展开研究,旨在为微创手术机器人导航提供算法支持。论文的主要内容和创新点如下:

(1)针对内窥镜图像手术器械分割任务中的反光和阴影等光照问题,本文提出了金字塔注意力聚合网络,其通过聚合多尺度的注意力特征来改善特征表示。该网络包括双注意力模块和金字塔上采样模块两个创新模块。双注意力模块捕获位置和通道之间的语义关系用于推断光照干扰区域的语义信息,从而提升网络对反光和阴影中的手术器械的分割精度。此外,金字塔上采样模块聚合多尺度注意力特征来捕获局部细节和全局信息,从而进一步改善网络的特征表示。实验结果表明,金字塔注意力聚合网络在内窥镜手术器械分割数据集EndoVis 2017上取得了优异的分割性能。

(2)针对内窥镜图像手术器械分割任务中的尺度变化问题以及细小器械分割问题,本文提出了自适应感受野网络,其可以为不同尺度的手术器械自适应地选择合适的感受野。在该网络中,自适应感受野模块被提出用于选择具有合适感受野的特征以适应手术器械的尺度变化。该模块将多尺度的特征作为输入,并利用通道间的关系进行多尺度特征的筛选。自适应感受野模块可以细化多尺度特征,覆盖更多的尺度范围,这也有助于细小手术器械的分割。此外,双线性注意力模块被设计用于捕捉通道间的语义关系使网络更加关注关键区域。该模块利用了通道关系来增强网络对手术器械的识别,而不是仅仅根据局部的颜色和纹理特征来识别手术器械,因此其不会受到反光和阴影的干扰,有助于解决光照问题。并且,自适应感受野网络采用膨胀残差网络来保留更多细节特征,从而提升对细小手术器械的分割精度。实验结果表明,自适应感受野网络在内窥镜手术器械分割数据集EndoVis 2018上取得了优异的分割性能。

(3)针对内窥镜图像软组织分割任务中的局部特征相似问题,本文提出了空间关系推理网络,其通过捕捉远距离语义关系来提升对局部特征的识别能力。该网络包括空间压缩推理模块和低秩双线性融合模块两个创新模块。空间压缩推理模块首先在垂直和水平方向压缩特征图,捕捉特定方向上的远距离语义信息。然后,计算每个水平位置和垂直位置之间的相似度,建立空间关系矩阵。最后建模通道间的关系以指导空间关系矩阵自适应地分布到原始特征空间。这样,空间压缩推理模块可以捕捉远距离语义关系,解决局部特征相似问题。此外,低秩双线性融合模块基于低秩双线性模型来融合浅层特征和深层特征,其可以提取细粒度的特征,增强不同语义特征之间的区别。实验结果表明,空间关系推理网络在软组织分割任务上取得了优异的分割性能。

(4)为了将分割模型在移动式的微创手术机器人进行部署,本文提出了类内自蒸馏算法用于模型压缩。类内自蒸馏算法被设置在分割模型的解码器部分,并采用多阶段的自上而下的方式进行知识传递。蒸馏特征的通道数被设置为与分割类别的总数一致,每个通道可以反映特定类别的特征分布。因此,可以通过监督特定的通道特征来学习特定类别的类内特征分布,而不会受到其他类的特征分布的干扰。这样,学生特征图可以更好地学习教师特征图的特征分布,改善网络的特征表示。基于类内自蒸馏算法,金字塔注意力聚合网络和空间关系推理网络被进行了压缩。实验结果表明,类内自蒸馏算法可以在显著减少模型计算复杂度和模型参数量的情况下提升模型的分割精度。

语种中文
页码123
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/48658]  
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
倪振梁. 面向微创手术的内窥镜影像关键区域分割方法研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 2022.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace