ShanghaiTech University Knowledge Management System
数据处理方法、装置、设备及存储介质 | |
申请号 | CN202210531314.9 |
2022-10-04 | |
公开(公告)号 | CN115145952A |
公开日期 | 2022-10-04 |
摘要 | 本公开涉及一种数据处理方法、装置、设备及存储介质。本公开通过采用预训练语言模型对包含有结构化数据的文本信息进行编码,得到所述结构化数据中的多个组成元素分别在所述文本信息中对应的上下文表示向量,由于预训练语言模型在大量数据上进行了预训练,因此能够更加细粒度地确定各个组成元素的含义,避免歧义。进一步,根据准确性较高的同一类型的多个组成元素分别对应的上下文表示向量,对该同一类型的多个组成元素进行聚类处理时可以提高聚类结果的准确度,根据该聚类结果可以对该第一数据集合进行较为准确的标准化处理,得到标准化的第二数据集合。从而可以从该标准化的第二数据集合中查询到全面、准确的目标数据。 |
当前权利人 | 阿里巴巴(中国)有限公司 ; 上海科技大学 |
专利代理人 | 张子青 |
代理机构 | 北京开阳星知识产权代理有限公司 11710 |
专利申请人 | 阿里巴巴(中国)有限公司; 上海科技大学 |
公开国别 | 中国 |
公开国别简称 | CN |
IPC 分类号 | G06F16//2453; G06F16//2458; G06F16//35; G06F16//36; G06F40//295; G06Q30//06 |
专利有效性 | 审中 |
专利类型 | 发明申请 |
专利类型字典 | 1 |
当前法律状态 | 实质审查 |
简单同族 | CN115145952A |
扩展同族 | CN115145952A |
INPADOC 同族 | CN115145952A |
文献类型 | 专利 |
条目标识符 | https://kms.shanghaitech.edu.cn/handle/2MSLDSTB/235564 |
专题 | 信息科学与技术学院_博士生 信息科学与技术学院_PI研究组_屠可伟组 物质科学与技术学院_博士生 |
作者单位 | 上海科技大学 |
推荐引用方式 GB/T 7714 | 蒋承越,蒋勇,王涛,等. 数据处理方法、装置、设备及存储介质. CN202210531314.9[P]. 2022-10-04. |
条目包含的文件 | ||||||
文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
数据处理方法、装置、设备及存储介质.pd(784KB) | 专利 | 限制开放 | CC BY-NC-SA | 请求全文 |
个性服务 |
查看访问统计 |
谷歌学术 |
谷歌学术中相似的文章 |
[蒋承越]的文章 |
[蒋勇]的文章 |
[王涛]的文章 |
百度学术 |
百度学术中相似的文章 |
[蒋承越]的文章 |
[蒋勇]的文章 |
[王涛]的文章 |
必应学术 |
必应学术中相似的文章 |
[蒋承越]的文章 |
[蒋勇]的文章 |
[王涛]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
修改评论
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。