×
验证码:
换一张
忘记密码?
记住我
CORC
首页
科研机构
检索
知识图谱
申请加入
托管服务
登录
注册
在结果中检索
科研机构
自动化研究所 [28]
沈阳自动化研究所 [4]
兰州理工大学 [2]
深圳先进技术研究院 [2]
清华大学 [1]
北京大学 [1]
更多...
内容类型
期刊论文 [24]
会议论文 [11]
学位论文 [4]
其他 [1]
发表日期
2023 [2]
2022 [6]
2021 [9]
2020 [5]
2019 [3]
2018 [4]
更多...
×
知识图谱
CORC
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共40条,第1-10条
帮助
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
作者升序
作者降序
题名升序
题名降序
发表日期升序
发表日期降序
提交时间升序
提交时间降序
Relay Hindsight Experience Replay: Self-guided continual reinforcement learning for sequential object manipulation tasks with sparse rewards
期刊论文
NEUROCOMPUTING, 2023, 卷号: 557
作者:
Luo, Yongle
;
Wang, Yuxin
;
Dong, Kun
;
Zhang, Qiang
;
Cheng, Erkang
收藏
  |  
浏览/下载:9/0
  |  
提交时间:2023/11/10
Deep reinforcement learning
Robotic manipulation
Continual learning
Hindsight experience replay
Sparse reward
Synergetic learning for unknown nonlinear
H.
control using neural networks
期刊论文
NEURAL NETWORKS, 2023, 卷号: 168, 页码: 287-299
作者:
Zhu, Liao
;
Guo, Ping
;
Wei, Qinglai
收藏
  |  
浏览/下载:0/0
  |  
提交时间:2023/12/21
H. control
Nonlinear systems
Adaptive dynamic programming
Temporal difference
Neural network
Data-driven
Online Minimax Q Network Learning for Two-Player Zero-Sum Markov Games
期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2022, 卷号: 33, 期号: 3, 页码: 1228-1241
作者:
Zhu, Yuanheng
;
Zhao, Dongbin
收藏
  |  
浏览/下载:14/0
  |  
提交时间:2022/06/10
Games
Nash equilibrium
Mathematical model
Markov processes
Convergence
Dynamic programming
Training
Deep reinforcement learning (DRL)
generalized policy iteration (GPI)
Markov game (MG)
Nash equilibrium
Q network
zero sum
Prioritized Experience Replay based on Multi-armed Bandit
期刊论文
EXPERT SYSTEMS WITH APPLICATIONS, 2022, 卷号: 189
作者:
Liu, Ximing
;
Zhu, Tianqing
;
Jiang, Cuiqing
;
Ye, Dayong
;
Zhao, Fuqing
收藏
  |  
浏览/下载:17/0
  |  
提交时间:2022/03/01
Deep reinforcement learning
Q-learning
Deep Q-network
Experience replay
Multi-armed Bandit
Barrier-Certified Learning-Enabled Safe Control Design for Systems Operating in Uncertain Environments
期刊论文
IEEE/CAA Journal of Automatica Sinica, 2022, 卷号: 9, 期号: 3, 页码: 437-449
作者:
Zahra Marvi
;
Bahare Kiumarsi
收藏
  |  
浏览/下载:38/0
  |  
提交时间:2022/03/09
Control barrier functions (CBFs)
experience replay
learning
safety-critical systems
uncertainty
移动机器人优先采样D3QN路径规划方法研究
期刊论文
小型微型计算机系统, 2022, 页码: 1-8
作者:
袁帅
;
张莉莉
;
顾琦然
;
张凤
;
吕佳琪
收藏
  |  
浏览/下载:27/0
  |  
提交时间:2022/03/15
DQN
D3QN-PER
LSTM
最优路径
p Finding the optimal multilayer network structure through reinforcement learning in fault diagnosis
期刊论文
MEASUREMENT, 2022, 卷号: 188
作者:
Cao, Jie
;
Ma, Jialin
;
Huang, Dailin
;
Yu, Ping
收藏
  |  
浏览/下载:14/0
  |  
提交时间:2022/03/01
Neural architecture search
Pareto efficiency
Reinforcement learning
Fault diagnosis
Multi-agent deep reinforcement learning for end–edge orchestrated resource allocation in industrialwireless networks
期刊论文
Frontiers of Information Technology & Electronic Engineering, 2022, 卷号: 23, 期号: 1, 页码: 47-60
作者:
Liu XY(刘晓宇)
;
Xu C(许驰)
;
Yu HB(于海斌)
;
Zeng P(曾鹏)
收藏
  |  
浏览/下载:19/0
  |  
提交时间:2022/01/27
Multi-agent deep reinforcement learning
End–edge orchestrated
Industrial wireless networks
Delay
Energy consumption
DIMSAN: Fast Exploration with the Synergy between Density-based Intrinsic Motivation and Self-adaptive Action Noise
会议论文
西安, 2021.5.30-2021.6.5
作者:
Li, Jiayi
;
Li, Boyao
;
Lu, Tao
;
Lu, Ning
;
Cai, Yinghao
收藏
  |  
浏览/下载:4/0
  |  
提交时间:2022/06/14
Trajectory-based Split Hindsight Reverse Curriculum Learning
会议论文
Prague, Czech Republic, 2021-9
作者:
Wu, Jiaxi
;
Zhang, Dianmin
;
Zhong, Shanlin
;
Qiao, Hong
收藏
  |  
浏览/下载:7/0
  |  
提交时间:2022/06/14
Reinforcement Learning
Curriculum Learning
©版权所有 ©2017 CSpace - Powered by
CSpace