大语言模型时代的落地方法论——成本、效率与效果
2023-06-10
发表期刊人工智能
ISSN2096-5036
期号03页码:52-61
发表状态已发表
DOI10.16453/j.2096-5036.2023.03.005
摘要

以GPT-4为代表的大语言模型(Large Language Model,LLM)展现出了惊人的通用智能潜力,基于相关技术,一系列大语言模型相继诞生。在这场技术变革中,一方面是巨大的参数量和计算量要求,另一方面是大量的使用需求和有限的算力资源支撑。如何使得其高效、低成本地规模性推广成为LLM更大范围落地的关键。本文围绕压缩、推理和评测三个角度,介绍相关大模型压缩技术和分布式推理技术,以及大模型在应用中的效果评估方式,探讨大语言模型时代的落地方法论,并对未来发展进行展望,期待推动大语言模型在各行各业的广大范围的应用和推广。

关键词大语言模型 轻量化 压缩 推理 人工智能
URL查看原文
语种中文
原始文献类型学术期刊
来源库CNKI
中图分类号TP18
文献类型期刊论文
条目标识符https://kms.shanghaitech.edu.cn/handle/2MSLDSTB/346125
专题信息科学与技术学院_硕士生
作者单位
1.商汤科技研究院;
2.上海科技大学;
3.北京航空航天大学软件开发环境国家重点实验室;
4.电子科技大学
推荐引用方式
GB/T 7714
龚睿昊,范云潜,魏秀颖,等. 大语言模型时代的落地方法论——成本、效率与效果[J]. 人工智能,2023(03):52-61.
APA 龚睿昊,范云潜,魏秀颖,白世豪,张运宸,&张祥国.(2023).大语言模型时代的落地方法论——成本、效率与效果.人工智能(03),52-61.
MLA 龚睿昊,et al."大语言模型时代的落地方法论——成本、效率与效果".人工智能 .03(2023):52-61.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[龚睿昊]的文章
[范云潜]的文章
[魏秀颖]的文章
百度学术
百度学术中相似的文章
[龚睿昊]的文章
[范云潜]的文章
[魏秀颖]的文章
必应学术
必应学术中相似的文章
[龚睿昊]的文章
[范云潜]的文章
[魏秀颖]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。