验证码:

换一张

忘记密码？记住我

取消登录

统一认证登录

取消

中文版 | English

上海科技大学知识管理系统

ShanghaiTech University Knowledge Management System

统一认证登录登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
学科分类
知识图谱
知识整合
学习讨论厅

在结果中检索

研究单元&专题

信息科学与技术学院 [3]

作者

文献类型

会议论文 [3]

发表日期

出处

29TH IEEE ... [1]

LEARNING F... [1]

PROCEEDING... [1]

语种

资助项目

Shanghai S... [1]

UKRI Turin... [1]

资助机构

收录类别

EI [3]

状态

知识图谱

KMS

浏览/检索结果: 共3条，第1-3条

帮助

已选(0)清除条数/页：排序方式：
	Learning to Shape Rewards Using a Game of Two Partners 会议论文 PROCEEDINGS OF THE 37TH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, AAAI 2023, Washington, DC, United states, February 7, 2023 - February 14, 2023 作者: Mguni, David; Jafferjee, Taher; Wang, Jianhong; Perez-Nieves, Nicolas; Song, Wenbin Adobe PDF(4032Kb) \| 收藏 \| 浏览/下载：178/2 \| 提交时间：2024/01/19 Domain Knowledge Learning algorithms Learning systems Autonomous learning Domain knowledge Error prones Learn+ Markov games Performance Reinforcement learnings Reward function Shaping algorithm Two agents
	Rectified Pessimistic-Optimistic Learning for Stochastic Continuum-armed Bandit with Constraints. 会议论文 LEARNING FOR DYNAMICS AND CONTROL CONFERENCE, VOL 211, Philadelphia, PA, United states, June 15, 2023 - June 16, 2023 作者: Guo Hengquan; Zhu Qi; Liu Xin Adobe PDF(3079Kb) \| 收藏 \| 浏览/下载：352/11 \| 提交时间：2023/03/25 Stochastic models Bayesian optimization Black boxes Constraint functions Constraint violation Cumulative constraints Hard constraints Optimistics Reward function Stochastic continuum-armed bandit Stochastics Hard constraint
	Designing Context-Sensitive Norm Inverse Reinforcement Learning Framework for Norm-Compliant Autonomous Agents 会议论文 29TH IEEE INTERNATIONAL CONFERENCE ON ROBOT AND HUMAN INTERACTIVE COMMUNICATION, RO-MAN 2020, Virtual, Naples, Italy, August 31, 2020 - September 4, 2020 作者: Yue Guo; Boshi Wang; Dana Hughes; Michael Lewis; Katia Sycara Adobe PDF(1439Kb) \| 收藏 \| 浏览/下载：471/126 \| 提交时间：2022/12/09 Inverse problems Robots Reinforcement learning Behavioral research Compliant behavior Context sensitive Context spaces Domestic robots Human behaviors Inverse reinforcement learning Modularized Reward function

首页
上一页
1
下一页
末页

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
使用帮助
联系我们

条目量26800
全文量25665
访问量15960688
下载量1062841

Copyright © 上海科技大学版权所有沪ICP备13001436号-1 沪公网安备 31011502006855号

地址邮编: 上海市浦东新区华夏中路393号
电话: 86-21-20685191