题名 | 基于模仿的机器人操作技能学习技术研究 |
作者 | 李博遥 |
答辩日期 | 2020-08-14 |
文献子类 | 硕士 |
授予单位 | 中国科学院大学 |
授予地点 | 中国科学院自动化研究所 |
导师 | 鲁涛 |
关键词 | 机器人学习 模仿学习 深度强化学习 好奇心驱动探索 分层机制 |
学位名称 | 工程硕士 |
学位专业 | 控制工程 |
英文摘要 | 近年来,人工智能技术的兴起推动了机器人行业的快速发展,各类机器人已广泛应用于工业生产、医疗救助、家庭生活等众多领域。随着应用场景的复杂化,机器人操作技能的智能化需求也在不断提升。受限于环境感知与控制策略学习等技术,机器人操作技能学习技术的发展依然面临着巨大的挑战。本文从模仿学习的角度研究机器人操作技能学习的相关技术,并在学习策略的探索及长时序、多步骤任务的分层模仿方面开展探讨。论文的主要工作如下: (1) 针对深度强化学习方法探索效率较低及在稀疏奖励场景下操作技能学习困难的问题,本文提出了一种增强型好奇心驱动经验回放机制。该方法将好奇心内在驱动机制及事后经验回放机制引入到策略探索中,通过定义任务相关因子,鼓励机器人探索与任务相关的未知新颖状态,从而提高控制策略的搜索能力,实现策略的快速收敛。实验结果表明,该方法在策略收敛速度及学习性能方面均展现出了较好的效果。 (2) 针对长时序、多步骤任务的操作技能学习问题,本文提出了一种基于分层机制的机器人操作技能模仿学习方法。该方法通过引入层级思想构建以操作物体为中心的任务分解机制,并结合专家示教数据和增强型好奇心策略搜索方法对各子任务技能进行模仿学习。同时提出基于并行训练方式的不同层级策略同步更新方法,在加快网络训练过程的基础上,提升了策略模型的整体性能。实验结果表明,该方法能够实现对复杂多步骤操作任务的有效学习。 (3) 设计了一种机器人操作技能模仿学习系统。该系统可通过编程或遥操作方式完成教师机器人在真实场景的技能演示,并通过实-虚环境数据转换在仿真环境中进行基于示教数据的操作技能策略训练,最终将策略模型部署到学生机器人上实现技能再现。该系统实现了“技能示教-虚拟训练-技能再现”的一体化模仿学习功能设计,为机器人技能传授、技能共享学习提供了验证测试平台。 |
语种 | 中文 |
页码 | 106 |
内容类型 | 学位论文 |
源URL | [http://ir.ia.ac.cn/handle/173211/40231] |
专题 | 毕业生_硕士学位论文 |
推荐引用方式 GB/T 7714 | 李博遥. 基于模仿的机器人操作技能学习技术研究[D]. 中国科学院自动化研究所. 中国科学院大学. 2020. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论