中国开放科研知识云: 检索

验证码:

换一张

忘记密码？记住我

取消登录

CORC

首页
科研机构
检索
知识图谱
申请加入
托管服务

在结果中检索

科研机构

自动化研究所 [15]

沈阳自动化研究所 [3]

北京航空航天大学 [2]

光电技术研究所 [2]

深圳先进技术研究院 [1]

计算技术研究所 [1]

内容类型

会议论文 [10]

期刊论文 [10]

学位论文 [7]

发表日期

知识图谱

CORC

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共27条，第1-10条

帮助

已选(0)清除条数/页：排序方式：
	执行者-评论家算法框架下的强化学习稳定性研究学位论文 2023 作者: 龚晨收藏 \| 浏览/下载：1/0 \| 提交时间：2023/06/26 深度强化学习，稳定性，共轭，对抗性攻击，后门攻击
	Privacy Preserving Demand Side Management Method via Multi-Agent Reinforcement Learning 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2023, 卷号: 10, 期号: 10, 页码: 1984-1999 作者: Feiye Zhang; Qingyu Yang; Dou An 收藏 \| 浏览/下载：7/0 \| 提交时间：2023/09/07 Centralized training and decentralized execution demand side management multi-agent reinforcement learning privacy preserving
	MUTS-Based Cooperative Target Stalking for A Multi-USV System 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2023, 卷号: 10, 期号: 7, 页码: 1582-1592 作者: Chengcheng Wang; Yulong Wang; Qing-Long Han; Yunkai Wu 收藏 \| 浏览/下载：5/0 \| 提交时间：2023/06/14 Cooperative target stalking improved deep reinforcement learning multi-unmanned surface vehicle (multi-USV) systems V-type probabilistic data extraction
	面向连续控制任务的深度强化学习值函数估计研究学位论文中国科学院自动化研究所: 中国科学院大学, 2022 作者: 何强收藏 \| 浏览/下载：22/0 \| 提交时间：2022/06/17 深度强化学习值函数估计值函数表示集成强化学习
	基于局部策略交互探索的深度确定性策略梯度的工业过程控制方法期刊论文计算机应用, 2022, 页码: 1-8 作者: 邓绍斌; 朱军; 周晓锋; 刘舒锐收藏 \| 浏览/下载：4/0 \| 提交时间：2022/03/15 工业过程控制深度强化学习深度确定性策略梯度学习效率青霉素仿真
	Deep Deterministic Policy Gradient for High-Speed Train Trajectory Optimization 期刊论文 IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS, 2021, 页码: 13 作者: Ning, Lingbin; Zhou, Min; Hou, Zhuopu; Goverde, Rob M. P.; Wang, Fei-Yue 收藏 \| 浏览/下载：42/0 \| 提交时间：2022/01/27 Rail transportation Training Heuristic algorithms Resistance Optimal control Trajectory optimization Switches High-speed railway train trajectory optimization deep deterministic policy gradient energy efficiency
	Wide-Sense Stationary Policy Optimization with Bellman Residual on Video Games 会议论文 Shenzhen, China, 05-09 July 2021 作者: Gong C(龚晨); He Q(何强); Bai YP(白云鹏); Hou XW(侯新文); Fan GL(范国梁) 收藏 \| 浏览/下载：4/0 \| 提交时间：2022/06/27 Video Game Reinforcement Learning Quantile Regression Bellman residual Wasserstein Distance
	一种基于规则迭代的无人车自学习控制方法学位论文中国科学院自动化研究所: 中国科学院大学, 2021 作者: 张力夫收藏 \| 浏览/下载：68/0 \| 提交时间：2021/06/27 无人车控制自主学习规则提取规则迭代
	未知环境下工业机械臂自主路径规划学位论文沈阳: 中国科学院沈阳自动化研究所, 2021 作者: 李振收藏 \| 浏览/下载：9/0 \| 提交时间：2021/06/12 路径规划 DDPG 估计奖励信任度加权动作
	Cooperatively Improving Data Center Energy Efficiency Based on Multi-Agent Deep Reinforcement Learning 期刊论文 ENERGIES, 2021, 卷号: 14, 期号: 8, 页码: 32 作者: Chi, Ce; Ji, Kaixuan; Song, Penglei; Marahatta, Avinab; Zhang, Shikui 收藏 \| 浏览/下载：11/0 \| 提交时间：2021/12/01 data center energy efficiency deep reinforcement learning multi-agent scheduling algorithm cooling system

相关链接
欧盟学术资源开放存取平台
CALIS高校机构知识库
台湾学术机构典藏
香港机构知识库整合系统
中国科学院机构知识库网格系统

CORC
关于我们
服务条款
隐私条款

联系我们
0931-8270076
cspace@llas.ac.cn
China-OR

中文简体

©版权所有 ©2017 CSpace - Powered by CSpace