| |||||||
ShanghaiTech University Knowledge Management System
序列视频中无对齐文本的弱监督视频表示学习方法 | |
申请号 | CN202310092247.X |
2023-05-02 | |
公开(公告)号 | CN116052054A |
公开日期 | 2023-05-02 |
摘要 | 本发明公开一种序列视频中无对齐文本的弱监督视频表示学习方法,其特征在于,包括以下步骤:获得帧特征、视频整体特征、句子特征和段落特征;使用多粒度对比学习损失函数来限制帧特征、视频整体特征、句子特征和段落特征,多粒度对比学习损失函数包括粗粒度的损失函数以及细粒度的损失函数。本发明提出了针对连续视频提出了一种新的具有未对齐文本的弱监督视频表征学习框架,并引入了多粒度对比损失来约束该网络模型,使得模型充分考虑了帧和句子之间的伪时间对齐,可以学习强大的具有语义的视频文本对表征。本发明提供的模型还展现出对下游任务的强大泛化能力,例如步骤级视频序列验证和文本到视频的匹配。 |
当前权利人 | 上海科技大学 |
专利代理人 | 翁若莹 ; 柏子雵 |
代理机构 | 上海申汇专利代理有限公司 31001 |
专利申请人 | 上海科技大学 |
公开国别 | CN |
公开国别简称 | CN |
IPC 分类号 | G06V20//40 ; G06V10//80 ; G06V10//82 ; G06F18//22 ; G06N3//04 ; G06N3//048 ; G06N3//084 ; G06N3//0895 |
专利有效性 | 审中 |
专利类型 | 发明申请 |
专利类型字典 | 1 |
当前法律状态 | 实质审查 |
简单同族 | CN116052054A |
扩展同族 | CN116052054A |
INPADOC 同族 | CN116052054A |
文献类型 | 专利 |
条目标识符 | https://kms.shanghaitech.edu.cn/handle/2MSLDSTB/295955 |
专题 | 信息科学与技术学院_硕士生 信息科学与技术学院_PI研究组_高盛华组 信息科学与技术学院_博士生 |
作者单位 | 上海科技大学 |
推荐引用方式 GB/T 7714 | 高盛华,董思勋,胡华章,等. 序列视频中无对齐文本的弱监督视频表示学习方法. CN202310092247.X[P]. 2023-05-02. |
条目包含的文件 | ||||||
文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 |
个性服务 |
查看访问统计 |
谷歌学术 |
谷歌学术中相似的文章 |
[高盛华]的文章 |
[董思勋]的文章 |
[胡华章]的文章 |
百度学术 |
百度学术中相似的文章 |
[高盛华]的文章 |
[董思勋]的文章 |
[胡华章]的文章 |
必应学术 |
必应学术中相似的文章 |
[高盛华]的文章 |
[董思勋]的文章 |
[胡华章]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
修改评论
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。