题名基于深度学习的三维点云识别算法研究
作者林华
答辩日期2020-05-29
文献子类硕士
授予单位中国科学院大学
授予地点中国科学院自动化研究所
导师潘春洪
关键词三维计算机视觉 深度学习 点云 形状上下文 几何模糊 旋转不变性
学位名称工程硕士
学位专业计算机技术
英文摘要

随着三维传感器的普及和计算机算力的提升,三维计算机视觉的研究吸引了越来越多研究人员的关注,相对于二维图像,三维数据可以轻易地实现物体与背景的解耦,因此三维计算机视觉的研究在自动驾驶、虚拟现实、机器人和遥感测绘等实际应用中具有重要的应用潜力和市场价值。三维点云是三维数据最直观的表示方式,如何有效地从三维点云中提取特征并进行识别分类一直是三维计算机视觉领域的研究热点。
为了使用卷积神经网络(convolution neural network, CNN)提取点云的内部特征,一些方法将点云转换为多视角图像或者三维体素,然而这些变换通常会导致三维点云中固有的几何信息大量丢失,并且具有很高的算法复杂度。近年来,越来越多的研究人员提出基于原始点云的三维点云识别算法,该方法直接作用于原始点云,而无需对其进行任何转换,因此没有显式的信息丢失。
由于点云数据的复杂性,基于深度学习的原始点云识别算法还面临着诸多挑战:
(1) 由于三维点云的无序性和非结构性,经典的 CNN 不能直接应用于原始三维点云的特征提取中,一些方法采用多层感知器提取点的特征,但其提取能力有限并且忽略了点与点之间的相关信息;
(2) 在实际应用场景中,三维点云不一定是对齐的,所以需要网络具备对于点云旋转、位移和尺度变化的鲁棒性;
(3) 传感器采集三维点云时难免会有噪声,需要算法具有一定的噪声鲁棒性。
本文围绕如何解决这几个问题进行了深入的研究,创新点包括:
(1)提出了一种新型三维点云上下文信息提取网络DSCNet。该方法采用形状上下文算法对点云的球形局部邻域进行划分,采用类似于几何模糊的方式模糊了球形邻域外围点的特征信息,形成一个包含粗糙和精细特征的上下文信息;最后基于前述的上下文信息,设计了一个多层次的网络从中学习形状特征。与目前其它优秀的方法相比,DSCNet不仅在上下文信息提取方面具有优势,而且对于点云噪声和稠密度具备更强的鲁棒性。此外,DSCNet还具备对点云的尺度、平移不变性 以及一定条件下的旋转不变性。本文通过丰富的实验证明了其有效性和先进性。
(2)提出了一种新的具有旋转不变性的点云学习网络DRINet。该方法采用距离信息表征点云中每个点的空间位置信息,核心思想是利用点与点之间的距离确定局部点云的内部刚性结构,由于这种表达方法只考虑了点与点之间的相对关系,因此对三维空间中的任意旋转都具有不变性;为了在该旋转不变的点云信息表征框架内有效提升网络的点云特征提取能力,本文提出在DRINet中使用一个基于注意力机制的自适应特征融合模型进行点云特征提取。本文在多个公开数据集上评估了该算法的表现,证明了其有效性。

语种中文
学科主题计算机感知 ; 计算机神经网络
页码96
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/39584]  
专题自动化研究所_模式识别国家重点实验室_遥感图像处理团队
推荐引用方式
GB/T 7714
林华. 基于深度学习的三维点云识别算法研究[D]. 中国科学院自动化研究所. 中国科学院大学. 2020.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace