×
验证码:
换一张
忘记密码?
记住我
×
统一认证登录
登录
中文版
|
English
上海科技大学知识管理系统
ShanghaiTech University Knowledge Management System
统一认证登录
登录
注册
ALL
ORCID
题名
作者
发表日期
关键词
文献类型
DOI
出处
存缴日期
收录类别
出版者
学习讨论厅
图片搜索
粘贴图片网址
首页
研究单元&专题
作者
文献类型
学科分类
知识图谱
知识整合
学习讨论厅
在结果中检索
研究单元&专题
信息科学与技术学院 [3]
作者
何旭明 [1]
赵子伯 [1]
吴隅 [1]
李荣颉 [1]
胡卫明 [1]
文献类型
会议论文 [2]
期刊论文 [1]
发表日期
2025 [1]
2024 [2]
出处
ACM INTERN... [1]
IEEE TRANS... [1]
PROCEEDING... [1]
语种
英语 [3]
资助项目
NSFC[62350... [1]
资助机构
收录类别
EI [3]
×
知识图谱
KMS
反馈留言
浏览/检索结果:
共3条,第1-3条
帮助
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
作者升序
作者降序
题名升序
题名降序
提交时间升序
提交时间降序
WOS被引频次升序
WOS被引频次降序
期刊影响因子升序
期刊影响因子降序
发表日期升序
发表日期降序
ShapeGPT: 3D Shape Generation with A Unified Multi-modal Language Model
期刊论文
IEEE TRANSACTIONS ON MULTIMEDIA, 2025, 卷号: PP, 期号: 99
作者:
Fukun Yin
;
Xin Chen
;
Chi Zhang
;
Biao Jiang
;
Zibo Zhao
Adobe PDF(6034Kb)
|
收藏
|
浏览/下载:45/3
|
提交时间:2025/02/12
3D modeling
Modula (programming language)
Syntactics
Three dimensional computer graphics
Unified Modeling Language
3-D shape
Generative model
Language model
Large models
Learn+
Modal language
Multi-modal
Multimodal generative model
Shape generations
Unified framework
UniGen: Unified Generative Pre-training for Multilingual Multimodal Representation
会议论文
ACM INTERNATIONAL CONFERENCE PROCEEDING SERIES, Tokyo, Japan, March 16, 2024 - March 18, 2024
作者:
Tian, Zheyuan
;
Luo, Guan
;
Wang, Bo
;
Li, Bing
;
Hu, Weiming
Adobe PDF(1018Kb)
|
收藏
|
浏览/下载:195/1
|
提交时间:2024/09/06
Autoregressive modelling
Generative model
Image data
Internet data
Multi-modal
Multilingual model
Multilingual texts
Multimodal pre-training
Pre-training
Text images
Learning by Correction: Efficient Tuning Task for Zero-Shot Generative Vision-Language Reasoning
会议论文
PROCEEDINGS OF THE IEEE COMPUTER SOCIETY CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION, Seattle, WA, United states, June 16, 2024 - June 22, 2024
作者:
Li, Rongjie
;
Wu, Yu
;
He, Xuming
Adobe PDF(2554Kb)
|
收藏
|
浏览/下载:28/1
|
提交时间:2025/03/28
Adversarial machine learning
Contrastive Learning
Generative adversarial networks
Visual languages
Image captioning
Image texts
Labelings
Language model
Multi-modal
Multimodal reasoning
Performance
Question Answering
Text generations
Vision-language
首页
上一页
1
下一页
末页