中国开放科研知识云: 检索

验证码:

换一张

忘记密码？记住我

取消登录

CORC

首页
科研机构
检索
知识图谱
申请加入
托管服务

在结果中检索

科研机构

自动化研究所 [28]

沈阳自动化研究所 [4]

兰州理工大学 [2]

深圳先进技术研究院 [2]

清华大学 [1]

北京大学 [1]

内容类型

期刊论文 [24]

会议论文 [11]

学位论文 [4]

发表日期

知识图谱

CORC

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共40条，第1-10条

帮助

已选(0)清除条数/页：排序方式：
	Relay Hindsight Experience Replay: Self-guided continual reinforcement learning for sequential object manipulation tasks with sparse rewards 期刊论文 NEUROCOMPUTING, 2023, 卷号: 557 作者: Luo, Yongle; Wang, Yuxin; Dong, Kun; Zhang, Qiang; Cheng, Erkang 收藏 \| 浏览/下载：9/0 \| 提交时间：2023/11/10 Deep reinforcement learning Robotic manipulation Continual learning Hindsight experience replay Sparse reward
	Synergetic learning for unknown nonlinear H. control using neural networks 期刊论文 NEURAL NETWORKS, 2023, 卷号: 168, 页码: 287-299 作者: Zhu, Liao; Guo, Ping; Wei, Qinglai 收藏 \| 浏览/下载：0/0 \| 提交时间：2023/12/21 H. control Nonlinear systems Adaptive dynamic programming Temporal difference Neural network Data-driven
	Online Minimax Q Network Learning for Two-Player Zero-Sum Markov Games 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2022, 卷号: 33, 期号: 3, 页码: 1228-1241 作者: Zhu, Yuanheng; Zhao, Dongbin 收藏 \| 浏览/下载：14/0 \| 提交时间：2022/06/10 Games Nash equilibrium Mathematical model Markov processes Convergence Dynamic programming Training Deep reinforcement learning (DRL) generalized policy iteration (GPI) Markov game (MG) Nash equilibrium Q network zero sum
	Prioritized Experience Replay based on Multi-armed Bandit 期刊论文 EXPERT SYSTEMS WITH APPLICATIONS, 2022, 卷号: 189 作者: Liu, Ximing; Zhu, Tianqing; Jiang, Cuiqing; Ye, Dayong; Zhao, Fuqing 收藏 \| 浏览/下载：17/0 \| 提交时间：2022/03/01 Deep reinforcement learning Q-learning Deep Q-network Experience replay Multi-armed Bandit
	Barrier-Certified Learning-Enabled Safe Control Design for Systems Operating in Uncertain Environments 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2022, 卷号: 9, 期号: 3, 页码: 437-449 作者: Zahra Marvi; Bahare Kiumarsi 收藏 \| 浏览/下载：38/0 \| 提交时间：2022/03/09 Control barrier functions (CBFs) experience replay learning safety-critical systems uncertainty
	移动机器人优先采样D3QN路径规划方法研究期刊论文小型微型计算机系统, 2022, 页码: 1-8 作者: 袁帅; 张莉莉; 顾琦然; 张凤; 吕佳琪收藏 \| 浏览/下载：27/0 \| 提交时间：2022/03/15 DQN D3QN-PER LSTM 最优路径
	p Finding the optimal multilayer network structure through reinforcement learning in fault diagnosis 期刊论文 MEASUREMENT, 2022, 卷号: 188 作者: Cao, Jie; Ma, Jialin; Huang, Dailin; Yu, Ping 收藏 \| 浏览/下载：14/0 \| 提交时间：2022/03/01 Neural architecture search Pareto efficiency Reinforcement learning Fault diagnosis
	Multi-agent deep reinforcement learning for end–edge orchestrated resource allocation in industrialwireless networks 期刊论文 Frontiers of Information Technology & Electronic Engineering, 2022, 卷号: 23, 期号: 1, 页码: 47-60 作者: Liu XY(刘晓宇); Xu C(许驰); Yu HB(于海斌); Zeng P(曾鹏) 收藏 \| 浏览/下载：19/0 \| 提交时间：2022/01/27 Multi-agent deep reinforcement learning End–edge orchestrated Industrial wireless networks Delay Energy consumption
	DIMSAN: Fast Exploration with the Synergy between Density-based Intrinsic Motivation and Self-adaptive Action Noise 会议论文西安, 2021.5.30-2021.6.5 作者: Li, Jiayi; Li, Boyao; Lu, Tao; Lu, Ning; Cai, Yinghao 收藏 \| 浏览/下载：4/0 \| 提交时间：2022/06/14
	Trajectory-based Split Hindsight Reverse Curriculum Learning 会议论文 Prague, Czech Republic, 2021-9 作者: Wu, Jiaxi; Zhang, Dianmin; Zhong, Shanlin; Qiao, Hong 收藏 \| 浏览/下载：7/0 \| 提交时间：2022/06/14 Reinforcement Learning Curriculum Learning

相关链接
欧盟学术资源开放存取平台
CALIS高校机构知识库
台湾学术机构典藏
香港机构知识库整合系统
中国科学院机构知识库网格系统

CORC
关于我们
服务条款
隐私条款

联系我们
0931-8270076
cspace@llas.ac.cn
China-OR

中文简体

©版权所有 ©2017 CSpace - Powered by CSpace