×
验证码:
换一张
忘记密码?
记住我
×
统一认证登录
登录
中文版
|
English
上海科技大学知识管理系统
ShanghaiTech University Knowledge Management System
统一认证登录
登录
注册
ALL
ORCID
题名
作者
发表日期
关键词
文献类型
DOI
出处
存缴日期
收录类别
出版者
学习讨论厅
图片搜索
粘贴图片网址
首页
研究单元&专题
作者
文献类型
学科分类
知识图谱
知识整合
学习讨论厅
在结果中检索
研究单元&专题
信息科学与技术学院 [5]
物质科学与技术学院 [1]
创意与艺术学院 [1]
作者
何旭明 [2]
汪婧雅 [2]
吴隅 [1]
武颖娜 [1]
杨锐 [1]
翟梓融 [1]
更多...
文献类型
期刊论文 [3]
会议论文 [2]
发表日期
2024 [2]
2023 [1]
2022 [2]
出处
COMPUTER V... [1]
IMAGE AND ... [1]
NEUROCOMPU... [1]
PROCEEDING... [1]
PROCEEDING... [1]
语种
英语 [5]
资助项目
CAS Interd... [1]
NSFC[62350... [1]
资助机构
收录类别
EI [5]
SCI [1]
SCIE [1]
SCOPUS [1]
状态
已发表 [4]
×
知识图谱
KMS
反馈留言
浏览/检索结果:
共5条,第1-5条
帮助
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
发表日期升序
发表日期降序
WOS被引频次升序
WOS被引频次降序
提交时间升序
提交时间降序
题名升序
题名降序
期刊影响因子升序
期刊影响因子降序
作者升序
作者降序
Mining Fine-Grained Image-Text Alignment for Zero-Shot Captioning via Text-Only Training
会议论文
PROCEEDINGS OF THE AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, Vancouver, BC, Canada, February 20, 2024 - February 27, 2024
作者:
Qiu, Longtian
;
Ning, Shan
;
He, Xuming
Adobe PDF(948Kb)
|
收藏
|
浏览/下载:390/47
|
提交时间:2024/04/26
Gaussian distribution
Breakings
Fine grained
Image captioning
Image texts
Performance
Power
Pre-training
Text alignments
Textual description
Visual feature
Learning by Correction: Efficient Tuning Task for Zero-Shot Generative Vision-Language Reasoning
会议论文
PROCEEDINGS OF THE IEEE COMPUTER SOCIETY CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION, Seattle, WA, United states, June 16, 2024 - June 22, 2024
作者:
Li, Rongjie
;
Wu, Yu
;
He, Xuming
Adobe PDF(2554Kb)
|
收藏
|
浏览/下载:46/4
|
提交时间:2025/03/28
Adversarial machine learning
Contrastive Learning
Generative adversarial networks
Visual languages
Image captioning
Image texts
Labelings
Language model
Multi-modal
Multimodal reasoning
Performance
Question Answering
Text generations
Vision-language
Cross-domain multi-style merge for image captioning
期刊论文
COMPUTER VISION AND IMAGE UNDERSTANDING, 2023, 卷号: 228
作者:
Duan, Yiqun
;
Wang, Zhen
;
Li, Yi
;
Wang, Jingya
Adobe PDF(894Kb)
|
收藏
|
浏览/下载:258/0
|
提交时间:2023/03/10
mage processing
Software engineering
Adversarial learning
Controllable generation
Cross-domain
Image caption
Image captioning
Multi-stages
Real data sets
Self-learning
Single domains
Vision and language
ArCo: Attention-reinforced transformer with contrastive learning for image captioning
期刊论文
IMAGE AND VISION COMPUTING, 2022, 卷号: 128
作者:
Wang, Zhongan
;
Shi, Shuai
;
Zhai, Zirong
;
Wu, Yingna
;
Yang, Rui
Adobe PDF(1398Kb)
|
收藏
|
浏览/下载:644/0
|
提交时间:2022/12/02
Contrastive learning
Image captioning
Transformer
Visual attention
Position-aware image captioning with spatial relation
期刊论文
NEUROCOMPUTING, 2022, 卷号: 497, 页码: 28-38
作者:
Duan, Yiqun
;
Wang, Zhen
;
Wang, Jingya
;
Wang, Yu-Kai
;
Lin, Chin-Teng
Adobe PDF(1769Kb)
|
收藏
|
浏览/下载:373/0
|
提交时间:2022/07/15
Deep learning
Natural language processing systems
Semantics
Visual languages
Deep learning
Embeddings
Image captioning
Language generation
Neural-networks
Spatial informations
Spatial relations
Transformer
Transformer modeling
Vision & language
首页
上一页
1
下一页
末页