已选(0)清除
条数/页: 排序方式:
|
| 执行者-评论家算法框架下的强化学习稳定性研究 学位论文 2023 作者: 龚晨 收藏  |  浏览/下载:1/0  |  提交时间:2023/06/26
|
| Privacy Preserving Demand Side Management Method via Multi-Agent Reinforcement Learning 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2023, 卷号: 10, 期号: 10, 页码: 1984-1999 作者: Feiye Zhang; Qingyu Yang; Dou An 收藏  |  浏览/下载:7/0  |  提交时间:2023/09/07
|
| MUTS-Based Cooperative Target Stalking for A Multi-USV System 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2023, 卷号: 10, 期号: 7, 页码: 1582-1592 作者: Chengcheng Wang; Yulong Wang; Qing-Long Han; Yunkai Wu 收藏  |  浏览/下载:5/0  |  提交时间:2023/06/14
|
| 面向连续控制任务的深度强化学习值函数估计研究 学位论文 中国科学院自动化研究所: 中国科学院大学, 2022 作者: 何强 收藏  |  浏览/下载:22/0  |  提交时间:2022/06/17
|
| 基于局部策略交互探索的深度确定性策略梯度的工业过程控制方法 期刊论文 计算机应用, 2022, 页码: 1-8 作者: 邓绍斌; 朱军; 周晓锋; 刘舒锐 收藏  |  浏览/下载:4/0  |  提交时间:2022/03/15
|
| Deep Deterministic Policy Gradient for High-Speed Train Trajectory Optimization 期刊论文 IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS, 2021, 页码: 13 作者: Ning, Lingbin; Zhou, Min; Hou, Zhuopu; Goverde, Rob M. P.; Wang, Fei-Yue 收藏  |  浏览/下载:42/0  |  提交时间:2022/01/27
|
| Wide-Sense Stationary Policy Optimization with Bellman Residual on Video Games 会议论文 Shenzhen, China, 05-09 July 2021 作者: Gong C(龚晨); He Q(何强); Bai YP(白云鹏); Hou XW(侯新文); Fan GL(范国梁) 收藏  |  浏览/下载:4/0  |  提交时间:2022/06/27
|
| 一种基于规则迭代的无人车自学习控制方法 学位论文 中国科学院自动化研究所: 中国科学院大学, 2021 作者: 张力夫 收藏  |  浏览/下载:68/0  |  提交时间:2021/06/27
|
| 未知环境下工业机械臂自主路径规划 学位论文 沈阳: 中国科学院沈阳自动化研究所, 2021 作者: 李振 收藏  |  浏览/下载:9/0  |  提交时间:2021/06/12
|
| Cooperatively Improving Data Center Energy Efficiency Based on Multi-Agent Deep Reinforcement Learning 期刊论文 ENERGIES, 2021, 卷号: 14, 期号: 8, 页码: 32 作者: Chi, Ce; Ji, Kaixuan; Song, Penglei; Marahatta, Avinab; Zhang, Shikui 收藏  |  浏览/下载:11/0  |  提交时间:2021/12/01
|