×
验证码:
换一张
忘记密码?
记住我
×
统一认证登录
登录
中文版
|
English
上海科技大学知识管理系统
ShanghaiTech University Knowledge Management System
统一认证登录
登录
注册
ALL
ORCID
题名
作者
发表日期
关键词
文献类型
DOI
出处
存缴日期
收录类别
出版者
学习讨论厅
图片搜索
粘贴图片网址
首页
研究单元&专题
作者
文献类型
学科分类
知识图谱
知识整合
学习讨论厅
在结果中检索
研究单元&专题
信息科学与技术学院 [3]
作者
汪博石 [1]
宋文斌 [1]
刘鑫 [1]
郭亨铨 [1]
朱琪 [1]
文献类型
会议论文 [3]
发表日期
2023 [2]
2020 [1]
出处
29TH IEEE ... [1]
LEARNING F... [1]
PROCEEDING... [1]
语种
英语 [3]
资助项目
Shanghai S... [1]
UKRI Turin... [1]
资助机构
收录类别
CPCI-S [3]
EI [3]
CPCI [1]
状态
已发表 [3]
×
知识图谱
KMS
反馈留言
浏览/检索结果:
共3条,第1-3条
帮助
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
题名升序
题名降序
期刊影响因子升序
期刊影响因子降序
WOS被引频次升序
WOS被引频次降序
提交时间升序
提交时间降序
作者升序
作者降序
发表日期升序
发表日期降序
Learning to Shape Rewards Using a Game of Two Partners
会议论文
PROCEEDINGS OF THE 37TH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, AAAI 2023, Washington, DC, United states, February 7, 2023 - February 14, 2023
作者:
Mguni, David
;
Jafferjee, Taher
;
Wang, Jianhong
;
Perez-Nieves, Nicolas
;
Song, Wenbin
Adobe PDF(4032Kb)
|
收藏
|
浏览/下载:178/2
|
提交时间:2024/01/19
Domain Knowledge
Learning algorithms
Learning systems
Autonomous learning
Domain knowledge
Error prones
Learn+
Markov games
Performance
Reinforcement learnings
Reward function
Shaping algorithm
Two agents
Rectified Pessimistic-Optimistic Learning for Stochastic Continuum-armed Bandit with Constraints.
会议论文
LEARNING FOR DYNAMICS AND CONTROL CONFERENCE, VOL 211, Philadelphia, PA, United states, June 15, 2023 - June 16, 2023
作者:
Guo Hengquan
;
Zhu Qi
;
Liu Xin
Adobe PDF(3079Kb)
|
收藏
|
浏览/下载:352/11
|
提交时间:2023/03/25
Stochastic models
Bayesian optimization
Black boxes
Constraint functions
Constraint violation
Cumulative constraints
Hard constraints
Optimistics
Reward function
Stochastic continuum-armed bandit
Stochastics
Hard constraint
Designing Context-Sensitive Norm Inverse Reinforcement Learning Framework for Norm-Compliant Autonomous Agents
会议论文
29TH IEEE INTERNATIONAL CONFERENCE ON ROBOT AND HUMAN INTERACTIVE COMMUNICATION, RO-MAN 2020, Virtual, Naples, Italy, August 31, 2020 - September 4, 2020
作者:
Yue Guo
;
Boshi Wang
;
Dana Hughes
;
Michael Lewis
;
Katia Sycara
Adobe PDF(1439Kb)
|
收藏
|
浏览/下载:471/126
|
提交时间:2022/12/09
Inverse problems
Robots
Reinforcement learning
Behavioral research
Compliant behavior
Context sensitive
Context spaces
Domestic robots
Human behaviors
Inverse reinforcement learning
Modularized
Reward function
首页
上一页
1
下一页
末页