CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 硕士学位论文
题名基于深度强化学习与力封闭融合的三指手机器人抓取方法研究
作者刘永乐
答辩日期2020-05-27
文献子类硕士
授予单位中国科学院大学
授予地点中国科学院自动化研究所
导师乔红
关键词机器人抓取 深度强化学习 力封闭 域随机化
学位名称工程硕士
学位专业控制工程
英文摘要

机器人是靠自身动力和控制能力来实现各种功能的一种机器。为了使机器人在真实的世界智能地与物体进行交互,感知,闭环的视觉控制以及灵活的操作都十分重要。其中,机器人灵活操作是机器人研究领域的重要研究问题之一,而稳定的物体抓取是机器人灵活操作的前提。基于此,本文通过力封闭分析方法以及深度强化学习方法对机器人稳定抓取进行了研究。

首先,由于深度确定性策略梯度(DDPG)算法可以处理连续控制问题,本文使用DDPG算法处理机器人抓取问题。针对DDPG算法样本使用效率低、学习速度慢、学习效果不理想等问题,融合多个DDPG算法的改进方法,如示教方法,数据优先重用机制等,以提高DDPG算法的性能及稳定性。

其次,分析了三指手稳定抓取力封闭方法。通过将DDPG算法与分析抓取稳定性的力封闭方法相结合,融入力封闭分析到DDPG算法的奖励机制中,实现了机器人对物体的稳定抓取。

最后,分别在仿真环境以及真实环境下对抓取方法进行了实验。在仿真实验中,针对本文提出的方法,从抓取成功率以及抓取稳定性两个重要方面进行了仿真实验。实验结果表明,机器人实现了接近90%的抓取成功率,并且抓取具有抗外力干扰的能力,实现了机器人抓取的稳定性。在实际环境的实验中,本文使用域随机化方法完成抓取策略从虚拟环境到真实环境的迁移,将在仿真中学习的策略直接应用在实体实验中,获得了较高的抓取成功率。

语种中文
页码68
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/39295]  
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
刘永乐. 基于深度强化学习与力封闭融合的三指手机器人抓取方法研究[D]. 中国科学院自动化研究所. 中国科学院大学. 2020.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace