消息
×
loading..
序列视频中无对齐文本的弱监督视频表示学习方法
申请号CN202310092247.X
2023-05-02
公开(公告)号CN116052054A
公开日期2023-05-02
摘要

本发明公开一种序列视频中无对齐文本的弱监督视频表示学习方法,其特征在于,包括以下步骤:获得帧特征、视频整体特征、句子特征和段落特征;使用多粒度对比学习损失函数来限制帧特征、视频整体特征、句子特征和段落特征,多粒度对比学习损失函数包括粗粒度的损失函数以及细粒度的损失函数。本发明提出了针对连续视频提出了一种新的具有未对齐文本的弱监督视频表征学习框架,并引入了多粒度对比损失来约束该网络模型,使得模型充分考虑了帧和句子之间的伪时间对齐,可以学习强大的具有语义的视频文本对表征。本发明提供的模型还展现出对下游任务的强大泛化能力,例如步骤级视频序列验证和文本到视频的匹配。

当前权利人上海科技大学
专利代理人翁若莹 ; 柏子雵
代理机构上海申汇专利代理有限公司 31001
专利申请人上海科技大学
公开国别CN
公开国别简称CN
IPC 分类号G06V20//40 ; G06V10//80 ; G06V10//82 ; G06F18//22 ; G06N3//04 ; G06N3//048 ; G06N3//084 ; G06N3//0895
专利有效性审中
专利类型发明申请
专利类型字典1
当前法律状态实质审查
简单同族CN116052054A
扩展同族CN116052054A
INPADOC 同族CN116052054A
文献类型专利
条目标识符https://kms.shanghaitech.edu.cn/handle/2MSLDSTB/295955
专题信息科学与技术学院_硕士生
信息科学与技术学院_PI研究组_高盛华组
信息科学与技术学院_博士生
作者单位
上海科技大学
推荐引用方式
GB/T 7714
高盛华,董思勋,胡华章,等. 序列视频中无对齐文本的弱监督视频表示学习方法. CN202310092247.X[P]. 2023-05-02.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[高盛华]的文章
[董思勋]的文章
[胡华章]的文章
百度学术
百度学术中相似的文章
[高盛华]的文章
[董思勋]的文章
[胡华章]的文章
必应学术
必应学术中相似的文章
[高盛华]的文章
[董思勋]的文章
[胡华章]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。