×
验证码:
换一张
忘记密码?
记住我
×
统一认证登录
登录
中文版
|
English
上海科技大学知识管理系统
ShanghaiTech University Knowledge Management System
统一认证登录
登录
注册
ALL
ORCID
题名
作者
发表日期
关键词
文献类型
DOI
出处
存缴日期
收录类别
出版者
学习讨论厅
图片搜索
粘贴图片网址
首页
研究单元&专题
作者
文献类型
学科分类
知识图谱
知识整合
学习讨论厅
在结果中检索
研究单元&专题
信息科学与技术学院 [4]
作者
徐兆辉 [4]
任海蒙 [2]
文献类型
会议论文 [2]
科技报告 [1]
预印本 [1]
发表日期
2025 [2]
2024 [2]
出处
2025 IEEE ... [1]
Arxiv [1]
PROCEEDING... [1]
语种
中文 [1]
英语 [1]
资助项目
资助机构
收录类别
EI [1]
×
知识图谱
KMS
反馈留言
(本次检索基于用户作品认领结果)
浏览/检索结果:
共4条,第1-4条
帮助
限定条件
作者:徐兆辉
第一作者
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
提交时间升序
提交时间降序
题名升序
题名降序
发表日期升序
发表日期降序
期刊影响因子升序
期刊影响因子降序
WOS被引频次升序
WOS被引频次降序
作者升序
作者降序
Make LLM Inference Affordable to Everyone: Augmenting GPU Memory with NDP-DIMM
会议论文
2025 IEEE INTERNATIONAL SYMPOSIUM ON HIGH PERFORMANCE COMPUTER ARCHITECTURE (HPCA), Las Vegas, NV, USA, 1-5 March 2025
作者:
Lian Liu
;
Shixin Zhao
;
Bing Li
;
Haimeng Ren
;
Zhaohui Xu
收藏
|
浏览/下载:12/0
|
提交时间:2025/04/14
基于动态量化的神经网络加速器软硬件协同设计方案
科技报告
报告类型: 工程报告, , 2025
作者:
徐兆辉
Adobe PDF(1016Kb)
|
收藏
|
浏览/下载:35/7
|
提交时间:2025/03/09
Drift: Leveraging Distribution-based Dynamic Precision Quantization for Efficient Deep Neural Network Acceleration
会议论文
PROCEEDINGS - DESIGN AUTOMATION CONFERENCE, San Francisco, CA, United states, June 23, 2024 - June 27, 2024
作者:
Liu, Lian
;
Xu, Zhaohui
;
He, Yintao
;
Wang, Ying
;
Li, Huawei
Adobe PDF(809Kb)
|
收藏
|
浏览/下载:112/3
|
提交时间:2024/12/27
Neural network models
Computational costs
Dynamic precision
Evaluation results
Language model
Model size
Neural network model
Neural-networks
Online scheduling
Quantisation
Quantization algorithms
COMET: Towards Partical W4A4KV4 LLMs Serving
预印本
2024
作者:
Adobe PDF(1293Kb)
|
收藏
|
浏览/下载:155/5
|
提交时间:2024/11/19
首页
上一页
1
下一页
末页