ShanghaiTech University Knowledge Management System
大语言模型时代的落地方法论——成本、效率与效果 | |
2023-06-10 | |
发表期刊 | 人工智能 |
ISSN | 2096-5036 |
期号 | 03页码:52-61 |
发表状态 | 已发表 |
DOI | 10.16453/j.2096-5036.2023.03.005 |
摘要 | 以GPT-4为代表的大语言模型(Large Language Model,LLM)展现出了惊人的通用智能潜力,基于相关技术,一系列大语言模型相继诞生。在这场技术变革中,一方面是巨大的参数量和计算量要求,另一方面是大量的使用需求和有限的算力资源支撑。如何使得其高效、低成本地规模性推广成为LLM更大范围落地的关键。本文围绕压缩、推理和评测三个角度,介绍相关大模型压缩技术和分布式推理技术,以及大模型在应用中的效果评估方式,探讨大语言模型时代的落地方法论,并对未来发展进行展望,期待推动大语言模型在各行各业的广大范围的应用和推广。 |
关键词 | 大语言模型 轻量化 压缩 推理 人工智能 |
URL | 查看原文 |
语种 | 中文 |
原始文献类型 | 学术期刊 |
来源库 | CNKI |
中图分类号 | TP18 |
文献类型 | 期刊论文 |
条目标识符 | https://kms.shanghaitech.edu.cn/handle/2MSLDSTB/346125 |
专题 | 信息科学与技术学院_硕士生 |
作者单位 | 1.商汤科技研究院; 2.上海科技大学; 3.北京航空航天大学软件开发环境国家重点实验室; 4.电子科技大学 |
推荐引用方式 GB/T 7714 | 龚睿昊,范云潜,魏秀颖,等. 大语言模型时代的落地方法论——成本、效率与效果[J]. 人工智能,2023(03):52-61. |
APA | 龚睿昊,范云潜,魏秀颖,白世豪,张运宸,&张祥国.(2023).大语言模型时代的落地方法论——成本、效率与效果.人工智能(03),52-61. |
MLA | 龚睿昊,et al."大语言模型时代的落地方法论——成本、效率与效果".人工智能 .03(2023):52-61. |
条目包含的文件 | ||||||
文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 |
个性服务 |
查看访问统计 |
谷歌学术 |
谷歌学术中相似的文章 |
[龚睿昊]的文章 |
[范云潜]的文章 |
[魏秀颖]的文章 |
百度学术 |
百度学术中相似的文章 |
[龚睿昊]的文章 |
[范云潜]的文章 |
[魏秀颖]的文章 |
必应学术 |
必应学术中相似的文章 |
[龚睿昊]的文章 |
[范云潜]的文章 |
[魏秀颖]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
修改评论
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。