已选(0)清除
条数/页: 排序方式:
|
| PiCor: Multi-Task Deep Reinforcement Learning with Policy Correction 会议论文 美国 华盛顿, 2023.02.07 - 2023.02.14 作者: Bai FS(白丰硕); Zhang HM(张鸿铭); Tao TY(陶天阳); Wu ZH(武志亨); Wang YN(王燕娜) 收藏  |  浏览/下载:13/0  |  提交时间:2023/07/05
|
| 面向稀疏奖励环境的多智能体协同探索问题研究 学位论文 2023 作者: 白云鹏 收藏  |  浏览/下载:4/0  |  提交时间:2023/06/13
|
| 基于多智能体强化学习的大规模路网交通信号控制 学位论文 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 陈筱语 收藏  |  浏览/下载:16/0  |  提交时间:2022/06/16
|
| 改进Q-Learning的WRSN充电路径规划算法 期刊论文 太赫兹科学与电子信息学报, 2022, 卷号: 20, 期号: 04, 页码: 393-401 作者: 刘洋; 王军; 吴云鹏 收藏  |  浏览/下载:1/0  |  提交时间:2023/05/18 |
| 基于观测空间关系提取的多智能体强化学习 期刊论文 计算机应用研究, 2022, 页码: 1-5 作者: 许书卿; 臧传治; 王鑫; 刘鼎; 刘玉奇 收藏  |  浏览/下载:10/0  |  提交时间:2022/06/16
|
| Multi-agent deep reinforcement learning for end–edge orchestrated resource allocation in industrialwireless networks 期刊论文 Frontiers of Information Technology & Electronic Engineering, 2022, 卷号: 23, 期号: 1, 页码: 47-60 作者: Liu XY(刘晓宇); Xu C(许驰); Yu HB(于海斌); Zeng P(曾鹏) 收藏  |  浏览/下载:20/0  |  提交时间:2022/01/27
|
| 基于多智能体深度强化学习的工业无线网络资源分配方法 专利 申请日期: 2021-10-22, 公开日期: 2022-05-06 作者: 于海斌; 刘晓宇; 许驰; 夏长清; 金曦 收藏  |  浏览/下载:11/0  |  提交时间:2021/12/13 |
| 基于多智能体深度强化学习的工业无线网络资源分配方法 专利 申请日期: 2021-10-22, 公开日期: 2022-05-06 作者: 于海斌; 刘晓宇; 许驰; 夏长清; 金曦 收藏  |  浏览/下载:6/0  |  提交时间:2022/05/24 |
| 分布式车间智能调度方法研究 学位论文 沈阳: 中国科学院沈阳自动化研究所, 2021 作者: 杨圣落 收藏  |  浏览/下载:12/0  |  提交时间:2021/06/12
|
| 未知环境下工业机械臂自主路径规划 学位论文 沈阳: 中国科学院沈阳自动化研究所, 2021 作者: 李振 收藏  |  浏览/下载:9/0  |  提交时间:2021/06/12
|