KMS

浏览/检索结果: 共4条,第1-4条 帮助

  只显示已认领条目
已选(0)清除 条数/页:   排序方式:
Enhancing Safety in Reinforcement Learning with Human Feedback via Rectified Policy Optimization 预印本
2024
作者:  Peng, Xiyue;  Guo, Hengquan;  Zhang, Jiawei;  Zou, Dongqing;  Shao, Ziyu
收藏  |  浏览/下载:198/0  |  提交时间:2024/12/17
无权访问的条目 学位论文
作者:  彭希玥
Adobe PDF(6797Kb)  |  收藏  |  浏览/下载:3/0  |  提交时间:2024/06/25
Adversarially Trained Weighted Actor-Critic for Safe Offline Reinforcement Learning 会议论文
THE 37TH ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS, NEURIPS 2024
作者:  Honghao Wei;  Peng XY(彭希玥);  Arnob Ghosh;  Liu X(刘鑫)
Adobe PDF(2735Kb)  |  收藏  |  浏览/下载:17/1  |  提交时间:2025/04/09
Adversarially Trained Actor Critic for offline CMDPs 预印本
2024
作者:  Wei, Honghao;  Peng, Xiyue;  Ghosh, Arnob;  Liu, Xin
Adobe PDF(3111Kb)  |  收藏  |  浏览/下载:336/3  |  提交时间:2024/03/04
  • 首页
  • 上一页
  • 1
  • 下一页
  • 末页