题名 | 基于值分解优化的多智能体深度强化学习方法研究 |
作者 | 王凌霄 |
答辩日期 | 2021-05-26 |
文献子类 | 硕士 |
授予单位 | 中国科学院自动化研究所 |
授予地点 | 中国科学院自动化研究所 |
导师 | 魏庆来 |
关键词 | 深度强化学习 多智能体系统 价值函数分解算法 图神经网络 |
学位名称 | 工程硕士 |
学位专业 | 控制工程 |
英文摘要 | 随着深度学习算法的实际效果和上下游软硬件的综合水平的大幅提升,深度学习技术开始被运用在信息科学各个领域的交叉性前沿研究中。最近三年来,深度学习方法已经在多智能体强化学习领域中成功地进行了许多探索,多智能体深度强化学习已经成为人工智能领域最近几年以来发展最为迅速的子方向之一。多智能体深度强化学习方向上的算法可以依据其背景设计原理分为几个技术路线大类,其中主要的技术路线包括基于同步通信的方法、基于价值函数分解的方法等等。本文针对多主体、连续时间、即时决策和不稳定通信环境下存在的新型问题,讨论了现有几种算法的应用局限和研究潜力,结合强化学习、图神经网络等领域的最新研究成果,提出了基于价值函数分解的多智能体深度强化学习算法的改进方法。
|
语种 | 中文 |
页码 | 100 |
内容类型 | 学位论文 |
源URL | [http://ir.ia.ac.cn/handle/173211/44697] |
专题 | 自动化研究所_复杂系统管理与控制国家重点实验室_智能化团队 |
推荐引用方式 GB/T 7714 | 王凌霄. 基于值分解优化的多智能体深度强化学习方法研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 2021. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论