KMS
(本次检索基于用户作品认领结果)

浏览/检索结果: 共4条,第1-4条 帮助

限定条件        
已选(0)清除 条数/页:   排序方式:
Make LLM Inference Affordable to Everyone: Augmenting GPU Memory with NDP-DIMM 会议论文
2025 IEEE INTERNATIONAL SYMPOSIUM ON HIGH PERFORMANCE COMPUTER ARCHITECTURE (HPCA), Las Vegas, NV, USA, 1-5 March 2025
作者:  Lian Liu;  Shixin Zhao;  Bing Li;  Haimeng Ren;  Zhaohui Xu
收藏  |  浏览/下载:12/0  |  提交时间:2025/04/14
基于动态量化的神经网络加速器软硬件协同设计方案 科技报告
报告类型: 工程报告, , 2025
作者:  徐兆辉
Adobe PDF(1016Kb)  |  收藏  |  浏览/下载:35/7  |  提交时间:2025/03/09
Drift: Leveraging Distribution-based Dynamic Precision Quantization for Efficient Deep Neural Network Acceleration 会议论文
PROCEEDINGS - DESIGN AUTOMATION CONFERENCE, San Francisco, CA, United states, June 23, 2024 - June 27, 2024
作者:  Liu, Lian;  Xu, Zhaohui;  He, Yintao;  Wang, Ying;  Li, Huawei
Adobe PDF(809Kb)  |  收藏  |  浏览/下载:112/3  |  提交时间:2024/12/27
COMET: Towards Partical W4A4KV4 LLMs Serving 预印本
2024
作者:  
Adobe PDF(1293Kb)  |  收藏  |  浏览/下载:155/5  |  提交时间:2024/11/19
  • 首页
  • 上一页
  • 1
  • 下一页
  • 末页