已选(0)清除
条数/页: 排序方式:
|
| Greedy feature replacement for online value function approximation 期刊论文 2016, 2016 Feng-fei ZHAO; Zheng QIN; Zhuo SHAO; Jun FANG; Bo-yan REN; Feng-fei ZHAO; Zheng QIN; Zhuo SHAO; Jun FANG; Bo-yan REN 收藏  |  浏览/下载:4/0 |
| 递阶再励学习中Option的自动发现与生成 期刊论文 2010, 2010 孟江华; 朱纪洪; 孙增圻; MENG Jiang-hua; ZHU Ji-hong; SUN Zeng-qi 收藏  |  浏览/下载:2/0 |
| 结构化状态空间中的递阶再励学习方法 期刊论文 2010, 2010 孟江华; 朱纪洪; 孙增圻; MENG Jiang-hua; ZHU Ji-hong; SUN Zeng-qi 收藏  |  浏览/下载:2/0 |
| 基于增强学习的半导体测试调度研究 期刊论文 2010, 2010 张智聪; 郑力; 翁小华; ZHANG Zhi-cong; ZHENG Li; WENG Xiaohua 收藏  |  浏览/下载:5/0 |
| 基于增强学习的平行机调度研究 期刊论文 2010, 2010 张智聪; 郑力; 翁小华; ZHANG Zhi-cong; ZHENG Li; WENG Michael X. 收藏  |  浏览/下载:3/0 |
| 优化加权平均流程时间的平行机调度 期刊论文 2010, 2010 张智聪; 郑力; 翁小华; Zhang Zhi-cong; Zheng Li; Michael X.Weng 收藏  |  浏览/下载:2/0 |
| Parallel machines scheduling with reinforcement learning 期刊论文 2010, 2010 Zhang Zhi-cong; Zheng Li; Weng, M.X. 收藏  |  浏览/下载:9/0 |
| Hierarchical reinforcement learning algorithm based on structural state-space 期刊论文 2010, 2010 Meng Jiang-hua; Zhu Ji-hong; Sun Zeng-qi 收藏  |  浏览/下载:4/0 |
| Autonomous discovery and creation of options in hierarchical reinforcement learning 期刊论文 2010, 2010 Meng Jiang-hua; Zhu Ji-hong; Sun Zeng-qi 收藏  |  浏览/下载:3/0 |