消息
×
loading..
×
验证码:
换一张
忘记密码?
记住我
×
统一认证登录
登录
中文版
|
English
上海科技大学知识管理系统
ShanghaiTech University Knowledge Management System
统一认证登录
登录
注册
ALL
ORCID
题名
作者
发表日期
关键词
文献类型
DOI
出处
存缴日期
收录类别
出版者
学习讨论厅
图片搜索
粘贴图片网址
首页
研究单元&专题
作者
文献类型
学科分类
知识图谱
知识整合
学习讨论厅
在结果中检索
研究单元&专题
信息科学与技术学院 [1]
作者
陈醉 [1]
文献类型
预印本 [2]
会议论文 [1]
发表日期
2025 [2]
2024 [1]
出处
Arxiv [2]
AAAI 2025 [1]
语种
英语 [2]
资助项目
Key Labora... [1]
National K... [1]
资助机构
收录类别
PPRN.PPRN [2]
×
知识图谱
KMS
反馈留言
浏览/检索结果:
共3条,第1-3条
帮助
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
WOS被引频次升序
WOS被引频次降序
提交时间升序
提交时间降序
发表日期升序
发表日期降序
作者升序
作者降序
期刊影响因子升序
期刊影响因子降序
题名升序
题名降序
What Are Step-Level Reward Models Rewarding? Counterintuitive Findings from MCTS-Boosted Mathematical Reasoning
会议论文
AAAI 2025
作者:
Ma, Yiran
;
Chen, Zui
;
Liu, Tianqiao
;
Tian, Mi
;
Liu, Zhuo
Adobe PDF(656Kb)
|
收藏
|
浏览/下载:15/2
|
提交时间:2025/03/09
Advancing Math Reasoning in Language Models: The Impact of Problem-Solving Data, Data Synthesis Methods, and Training Stages
预印本
2025
作者:
Chen, Zui
;
Liu, Tianqiao
;
Tian, Mi
;
Tong, Qing
;
Luo, Weiqi
收藏
|
浏览/下载:5/0
|
提交时间:2025/03/25
What Are Step-Level Reward Models Rewarding? Counterintuitive Findings from MCTS-Boosted Mathematical Reasoning
预印本
2024
作者:
Ma, Yiran
;
Chen, Zui
;
Liu, Tianqiao
;
Tian, Mi
;
Liu, Zhuo
收藏
|
浏览/下载:14/0
|
提交时间:2025/02/12
首页
上一页
1
下一页
末页