数据处理方法、装置、设备及存储介质
申请号CN202210531314.9
2022-10-04
公开(公告)号CN115145952A
公开日期2022-10-04
摘要本公开涉及一种数据处理方法、装置、设备及存储介质。本公开通过采用预训练语言模型对包含有结构化数据的文本信息进行编码,得到所述结构化数据中的多个组成元素分别在所述文本信息中对应的上下文表示向量,由于预训练语言模型在大量数据上进行了预训练,因此能够更加细粒度地确定各个组成元素的含义,避免歧义。进一步,根据准确性较高的同一类型的多个组成元素分别对应的上下文表示向量,对该同一类型的多个组成元素进行聚类处理时可以提高聚类结果的准确度,根据该聚类结果可以对该第一数据集合进行较为准确的标准化处理,得到标准化的第二数据集合。从而可以从该标准化的第二数据集合中查询到全面、准确的目标数据。
当前权利人阿里巴巴(中国)有限公司 ; 上海科技大学
专利代理人张子青
代理机构北京开阳星知识产权代理有限公司 11710
专利申请人阿里巴巴(中国)有限公司; 上海科技大学
公开国别中国
公开国别简称CN
IPC 分类号G06F16//2453; G06F16//2458; G06F16//35; G06F16//36; G06F40//295; G06Q30//06
专利有效性审中
专利类型发明申请
专利类型字典1
当前法律状态实质审查
简单同族CN115145952A
扩展同族CN115145952A
INPADOC 同族CN115145952A
文献类型专利
条目标识符https://kms.shanghaitech.edu.cn/handle/2MSLDSTB/235564
专题信息科学与技术学院_博士生
信息科学与技术学院_PI研究组_屠可伟组
物质科学与技术学院_博士生
作者单位
上海科技大学
推荐引用方式
GB/T 7714
蒋承越,蒋勇,王涛,等. 数据处理方法、装置、设备及存储介质. CN202210531314.9[P]. 2022-10-04.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
数据处理方法、装置、设备及存储介质.pd(784KB)专利 限制开放CC BY-NC-SA请求全文
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[蒋承越]的文章
[蒋勇]的文章
[王涛]的文章
百度学术
百度学术中相似的文章
[蒋承越]的文章
[蒋勇]的文章
[王涛]的文章
必应学术
必应学术中相似的文章
[蒋承越]的文章
[蒋勇]的文章
[王涛]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。