CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 硕士学位论文
题名基于RGB-D的室外行人检测研究
作者朱新亮
学位类别工学硕士
答辩日期2015-05-29
授予单位中国科学院大学
授予地点中国科学院自动化研究所
导师汤淑明
关键词行人检测 RGB-D 图像配准 深度图像去噪 Pedestrian Detection RGB-D Image Registration Depth Image De-noising
其他题名Research on RGB-D Based Outdoor Pedestrian Detection
学位专业控制理论与控制工程
中文摘要行人检测是计算机视觉领域的研究热点之一,也是智能交通和无人驾驶技术的重要研究内容;同时还是众多视觉应用的基础,比如行人跟踪与行人行为识别。目前行人检测方法从传感器角度主要可分为基于单目视觉、立体视觉以及融合视觉与激光雷达等三种方式。其中,基于单目视觉的方式容易受光照和角度的影响;立体视觉获得的深度图像具有速度较慢且不稳定的缺陷;激光雷达获取的点云则太稀疏,导致物体类别层面的识别变得困难。由于在RGB图像的基础上引入了深度图像,RGB-D图像比立体视觉产生更快更稳定的深度图以及比激光雷达提供更丰富的点云信息,因此最近几年引起研究人员的广泛关注。目前基于RGB-D的各类研究仅限于采用Kinect等可以使用的室内环境;对于室外环境,由于受到传感器等因素的限制,基于RGB-D的行人检测尚未有相关论文发表,因此非常值得研究。 本文针对行人检测的难点以及RGB-D的优势与局限性,展开室外环境下基于RGB-D行人检测的方法研究。本文的主要工作和主要贡献总结如下: · 提出一套室外环境下采集RGB-D图像的方案,该方案基于普通RGB相机以及TOF相机;创新地提出一种基于针孔相机模型的图像配准方法,取得了良好的效果。 · 针对行人检测领域缺乏公开的室外RGB-D数据库的情况,我们建立了基于RGB-D的行人检测数据库。该数据库包含了不同时段、不同环境下拍摄的12000多张图像(对),并对数据库中的行人做了仔细的标注。针对深度相机采集的图像中存在大量噪声的问题,本文提出了一种局部方差自适应阈值的去噪方法,相比于高斯低通滤波器,该方法能够在保证图像质量的情况下有效滤除一定范围内的图像噪声。 · 受主动传感器可以更容易探测到空间中物体的启发,论文创新地提出了一种基于深度信息引导的行人检测框架,这种检测框架可以为RGB图像中的行人检测缩小搜索区域,从而节省大量的计算。由于基于深度图像的特征提取方法很少,本文将图像识别领域中的核化特征方法引入到RGB-D的行人检测问题中,以提升行人检测的效果。在数据融合策略上,本文改进了一种在分类器层级的融合策略,这种策略比原始的策略具有更强的自适应性,并通过实验证明了基于RGB-D的行人检测方法的可行性与有效性。
英文摘要As a popular research topic, pedestrian detection has played an important role in both Intelligent Transportation Systems and Autonomous Vehicles. It is also the basis of pedestrian tracking and behaviour recognition. The most used sensors monocular camera, stereo camera and combining cameras with LIDAR for pedestrian detection all have their own drawbacks. Compared with data acquired by these sensors, RGB-D images have the following main advantages: (1) by incorporating depth information on the basis of RGB images, they can resist bad light condition to some degree; (2) they can be collected faster and more steadily than stereo images; (3) they contain more dense depth data than LIDAR. All these advantages of RGB-D images attract huge researchers’ enthusiasm. However, due to the limits of sensors, the researches based on RGB-D images are all currently limited to the indoor scenes using Kinect. There is no published paper on pedestrian detection in outdoor images collected by other RGB-D sensors. Motivated by the advantages of RGB-D images, we conduct our research work to improve the performance of pedestrian detection based on RGB-D images. The main contributions of this paper are as follows. · A proper solution to collect RGB images and depth images outdoors is proposed. By creatively proposing an algorithm based on the pinhole camera model, we solve the image registration problem and thus we can collect RGB-D images outdoors. · Due to the lack of public RGB-D based pedestrian dataset outdoor, we create a RGB-D pedestrian detection dataset, which contains over12000 RGB-D images and are with detailed annotations. · A novel local variance based adaptive threshold algorithm to de-noise the depth images is proposed. The experiment shows that it can de-noise the depth image more effectively than Gaussian and Laplacian filters. · We conduct our research and experiments on RGB-D based pedestrian detection algorithms. A novel depth-guided pedestrian detection framework to improve the detection speed and accuracy is proposed.
语种中文
其他标识符201228014628027
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/7779]  
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
朱新亮. 基于RGB-D的室外行人检测研究[D]. 中国科学院自动化研究所. 中国科学院大学. 2015.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace