×
验证码:
换一张
忘记密码?
记住我
×
统一认证登录
登录
中文版
|
English
上海科技大学知识管理系统
ShanghaiTech University Knowledge Management System
统一认证登录
登录
注册
ALL
ORCID
题名
作者
发表日期
关键词
文献类型
DOI
出处
存缴日期
收录类别
出版者
学习讨论厅
图片搜索
粘贴图片网址
首页
研究单元&专题
作者
文献类型
学科分类
知识图谱
知识整合
学习讨论厅
在结果中检索
研究单元&专题
信息科学与技术学院 [2]
作者
哈亚军 [1]
姜伟雄 [1]
任海蒙 [1]
徐兆辉 [1]
文献类型
会议论文 [2]
发表日期
2025 [1]
2022 [1]
出处
IEEE/ACM I... [1]
INTERNATIO... [1]
语种
英语 [2]
资助项目
National K... [1]
National N... [1]
资助机构
收录类别
EI [2]
CPCI-S [1]
状态
已发表 [2]
×
知识图谱
KMS
反馈留言
浏览/检索结果:
共2条,第1-2条
帮助
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
作者升序
作者降序
期刊影响因子升序
期刊影响因子降序
发表日期升序
发表日期降序
WOS被引频次升序
WOS被引频次降序
提交时间升序
提交时间降序
题名升序
题名降序
COMET: Towards Practical W4A4KV4 LLMs Serving
会议论文
INTERNATIONAL CONFERENCE ON ARCHITECTURAL SUPPORT FOR PROGRAMMING LANGUAGES AND OPERATING SYSTEMS - ASPLOS, Rotterdam, Netherlands, March 30, 2025 - April 3, 2025
作者:
Liu, Lian
;
Cheng, Long
;
Ren, Haimeng
;
Xu, Zhaohui
;
Pan, Yudong
Adobe PDF(2187Kb)
|
收藏
|
浏览/下载:33/1
|
提交时间:2025/05/09
Cache memory
Compaction
Computer graphics equipment
Graphics processing unit
Integrated circuit design
Modeling languages
Problem oriented languages
Algorithm
system co
design
Bit weight
Co
designs
Language model
Large language model serving
Large language model quantization
Mixed precision
Modeling quantizations
Quantisation
WSQ-AdderNet: Efficient weight standardization based quantized AdderNet FPGA accelerator design with high-density INT8 DSP-LUT co-packing optimization
会议论文
IEEE/ACM INTERNATIONAL CONFERENCE ON COMPUTER-AIDED DESIGN, DIGEST OF TECHNICAL PAPERS, ICCAD, San Diego, CA, United states, October 30, 2022 - November 4, 2022
作者:
Yunxiang Zhang
;
Biao Sun
;
Weixiong Jiang
;
Yajun Ha
;
Miao Hu
Adobe PDF(358Kb)
|
收藏
|
浏览/下载:293/0
|
提交时间:2023/03/10
onvolution
Convolutional neural networks
Digital signal processing
High level synthesis
Integrated circuit design
Network architecture
Standardization
Accelerator design
Addernet
Convolutional neural network
DSP packing
FPGA neural network accelerator
Modeling quantizations
Neural-networks
Packing optimization
Quantisation
SIMD
首页
上一页
1
下一页
末页