基于深度强化学习与力封闭融合的三指手机器人抓取方法研究

CORC > 自动化研究所 > 中国科学院自动化研究所 > 毕业生 > 硕士学位论文

题名	基于深度强化学习与力封闭融合的三指手机器人抓取方法研究
作者	刘永乐
答辩日期	2020-05-27
文献子类	硕士
授予单位	中国科学院大学
授予地点	中国科学院自动化研究所
导师	乔红
关键词	机器人抓取深度强化学习力封闭域随机化
学位名称	工程硕士
学位专业	控制工程
英文摘要	机器人是靠自身动力和控制能力来实现各种功能的一种机器。为了使机器人在真实的世界智能地与物体进行交互，感知，闭环的视觉控制以及灵活的操作都十分重要。其中，机器人灵活操作是机器人研究领域的重要研究问题之一，而稳定的物体抓取是机器人灵活操作的前提。基于此，本文通过力封闭分析方法以及深度强化学习方法对机器人稳定抓取进行了研究。首先，由于深度确定性策略梯度（DDPG）算法可以处理连续控制问题，本文使用DDPG算法处理机器人抓取问题。针对DDPG算法样本使用效率低、学习速度慢、学习效果不理想等问题，融合多个DDPG算法的改进方法，如示教方法，数据优先重用机制等，以提高DDPG算法的性能及稳定性。其次，分析了三指手稳定抓取力封闭方法。通过将DDPG算法与分析抓取稳定性的力封闭方法相结合，融入力封闭分析到DDPG算法的奖励机制中，实现了机器人对物体的稳定抓取。最后，分别在仿真环境以及真实环境下对抓取方法进行了实验。在仿真实验中，针对本文提出的方法，从抓取成功率以及抓取稳定性两个重要方面进行了仿真实验。实验结果表明，机器人实现了接近90%的抓取成功率，并且抓取具有抗外力干扰的能力，实现了机器人抓取的稳定性。在实际环境的实验中，本文使用域随机化方法完成抓取策略从虚拟环境到真实环境的迁移，将在仿真中学习的策略直接应用在实体实验中，获得了较高的抓取成功率。
语种	中文
页码	68
内容类型	学位论文
源URL	[http://ir.ia.ac.cn/handle/173211/39295]
专题	毕业生_硕士学位论文
推荐引用方式 GB/T 7714	刘永乐. 基于深度强化学习与力封闭融合的三指手机器人抓取方法研究[D]. 中国科学院自动化研究所. 中国科学院大学. 2020.

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接

CORC

联系我们