×
验证码:
换一张
忘记密码?
记住我
×
统一认证登录
登录
中文版
|
English
上海科技大学知识管理系统
ShanghaiTech University Knowledge Management System
统一认证登录
登录
注册
ALL
ORCID
题名
作者
发表日期
关键词
文献类型
DOI
出处
存缴日期
收录类别
出版者
学习讨论厅
图片搜索
粘贴图片网址
首页
研究单元&专题
作者
文献类型
学科分类
知识图谱
知识整合
学习讨论厅
在结果中检索
研究单元&专题
信息科学与技术学院 [4]
作者
任海蒙 [4]
徐兆辉 [3]
文献类型
会议论文 [2]
预印本 [2]
发表日期
2025 [2]
2024 [1]
2023 [1]
出处
Arxiv [2]
2025 IEEE ... [1]
INTERNATIO... [1]
语种
英语 [2]
资助项目
National K... [1]
National N... [1]
资助机构
收录类别
EI [2]
CPCI-S [1]
状态
已发表 [4]
×
知识图谱
KMS
反馈留言
浏览/检索结果:
共4条,第1-4条
帮助
只显示已认领条目
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
提交时间升序
提交时间降序
WOS被引频次升序
WOS被引频次降序
题名升序
题名降序
发表日期升序
发表日期降序
作者升序
作者降序
期刊影响因子升序
期刊影响因子降序
Make LLM Inference Affordable to Everyone: Augmenting GPU Memory with NDP-DIMM
会议论文
2025 IEEE INTERNATIONAL SYMPOSIUM ON HIGH PERFORMANCE COMPUTER ARCHITECTURE (HPCA), Las Vegas, NV, USA, 1-5 March 2025
作者:
Lian Liu
;
Shixin Zhao
;
Bing Li
;
Haimeng Ren
;
Zhaohui Xu
Adobe PDF(1300Kb)
|
收藏
|
浏览/下载:30/1
|
提交时间:2025/04/14
Analog storage
Computer graphics equipment
Graphics processing unit
Neurons
Problem oriented languages
Static random access storage
'current
Computational loads
Cost effective
Data processing units
Language model
Model inference
Modeling parameters
Performance
Real- time
Weight parameters
COMET: Towards Practical W4A4KV4 LLMs Serving
会议论文
INTERNATIONAL CONFERENCE ON ARCHITECTURAL SUPPORT FOR PROGRAMMING LANGUAGES AND OPERATING SYSTEMS - ASPLOS, Rotterdam, Netherlands, March 30, 2025 - April 3, 2025
作者:
Liu, Lian
;
Cheng, Long
;
Ren, Haimeng
;
Xu, Zhaohui
;
Pan, Yudong
Adobe PDF(2187Kb)
|
收藏
|
浏览/下载:28/1
|
提交时间:2025/05/09
Cache memory
Compaction
Computer graphics equipment
Graphics processing unit
Integrated circuit design
Modeling languages
Problem oriented languages
Algorithm
system co
design
Bit weight
Co
designs
Language model
Large language model serving
Large language model quantization
Mixed precision
Modeling quantizations
Quantisation
COMET: Towards Partical W4A4KV4 LLMs Serving
预印本
2024
作者:
Liu, Lian
;
Ren, Haimeng
;
Cheng, Long
;
Xu, Zhaohui
;
Pan, Yudong
Adobe PDF(1293Kb)
|
收藏
|
浏览/下载:176/5
|
提交时间:2024/11/19
ChipGPT: How far are we from natural language hardware design
预印本
2023
作者:
Chang, Kaiyan
;
Wang, Ying
;
Ren, Haimeng
;
Wang, Mengdi
;
Liang, Shengwen
Adobe PDF(1684Kb)
|
收藏
|
浏览/下载:209/0
|
提交时间:2024/01/09
agile hardware development
natural language programming
program synthesis
首页
上一页
1
下一页
末页