CORC

浏览/检索结果: 共27条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
执行者-评论家算法框架下的强化学习稳定性研究 学位论文
2023
作者:  龚晨
收藏  |  浏览/下载:1/0  |  提交时间:2023/06/26
Privacy Preserving Demand Side Management Method via Multi-Agent Reinforcement Learning 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2023, 卷号: 10, 期号: 10, 页码: 1984-1999
作者:  Feiye Zhang;  Qingyu Yang;  Dou An
收藏  |  浏览/下载:7/0  |  提交时间:2023/09/07
MUTS-Based Cooperative Target Stalking for A Multi-USV System 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2023, 卷号: 10, 期号: 7, 页码: 1582-1592
作者:  Chengcheng Wang;  Yulong Wang;  Qing-Long Han;  Yunkai Wu
收藏  |  浏览/下载:5/0  |  提交时间:2023/06/14
面向连续控制任务的深度强化学习值函数估计研究 学位论文
中国科学院自动化研究所: 中国科学院大学, 2022
作者:  何强
收藏  |  浏览/下载:22/0  |  提交时间:2022/06/17
基于局部策略交互探索的深度确定性策略梯度的工业过程控制方法 期刊论文
计算机应用, 2022, 页码: 1-8
作者:  邓绍斌;  朱军;  周晓锋;  刘舒锐
收藏  |  浏览/下载:4/0  |  提交时间:2022/03/15
Deep Deterministic Policy Gradient for High-Speed Train Trajectory Optimization 期刊论文
IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS, 2021, 页码: 13
作者:  Ning, Lingbin;  Zhou, Min;  Hou, Zhuopu;  Goverde, Rob M. P.;  Wang, Fei-Yue
收藏  |  浏览/下载:42/0  |  提交时间:2022/01/27
Wide-Sense Stationary Policy Optimization with Bellman Residual on Video Games 会议论文
Shenzhen, China, 05-09 July 2021
作者:  Gong C(龚晨);  He Q(何强);  Bai YP(白云鹏);  Hou XW(侯新文);  Fan GL(范国梁)
收藏  |  浏览/下载:4/0  |  提交时间:2022/06/27
一种基于规则迭代的无人车自学习控制方法 学位论文
中国科学院自动化研究所: 中国科学院大学, 2021
作者:  张力夫
收藏  |  浏览/下载:68/0  |  提交时间:2021/06/27
未知环境下工业机械臂自主路径规划 学位论文
沈阳: 中国科学院沈阳自动化研究所, 2021
作者:  李振
收藏  |  浏览/下载:9/0  |  提交时间:2021/06/12
Cooperatively Improving Data Center Energy Efficiency Based on Multi-Agent Deep Reinforcement Learning 期刊论文
ENERGIES, 2021, 卷号: 14, 期号: 8, 页码: 32
作者:  Chi, Ce;  Ji, Kaixuan;  Song, Penglei;  Marahatta, Avinab;  Zhang, Shikui
收藏  |  浏览/下载:11/0  |  提交时间:2021/12/01


©版权所有 ©2017 CSpace - Powered by CSpace