ShanghaiTech University Knowledge Management System
基于特征编码和图嵌入的姓名消歧方法 | |
其他题名 | Name disambiguation based on encoding attributes and graph topology |
2022-05-15 | |
发表期刊 | 中国科学院大学学报 |
ISSN | 2095-6134 |
卷号 | 39期号:3页码:360-368 |
DOI | 10.7523/j.ucas.2020.0019 |
摘要 | 针对作者姓名歧义问题,提出基于特征编码和图嵌入的作者姓名消歧方法.该方法首先利用word2vec模型对文档的属性特征进行编码从而构建文档的表征向量,然后采用图自动编码器将文档关系编码至文档向量中,聚类相似文档.为进一步提升聚类结果的准确性,使用图嵌入的方法将文档关系网络和作者关系网络的拓扑结构信息引入文档向量,进一步聚集相关文档.该方法同时利用文档的属性特征以及多个关系网络的信息,通过无监督学习的方法寻找文档表征向量,实现良好的姓名消歧效果.在真实作者数据集AMiner上的测试结果表明,该方法显著优于目前几个其他基于图网络的方法. |
关键词 | 姓名消歧 图神经网络 聚类方法 特征提取 图嵌入 |
URL | 查看原文 |
收录类别 | 北大核心 ; CSCD |
语种 | 中文 |
原始文献类型 | Periodical |
来源库 | WanFang |
中图分类号 | TP391.1 |
资助机构 | 国家自然科学基金 |
文献类型 | 期刊论文 |
条目标识符 | https://kms.shanghaitech.edu.cn/handle/2MSLDSTB/256257 |
专题 | 信息科学与技术学院_硕士生 信息科学与技术学院_PI研究组_吴幼龙组 |
作者单位 | 1.上海科技大学信息科学与技术学院,上海201210; 2.中国科学院上海微系统与信息技术研究所,上海200050; 3.中国科学院大学,北京100049 |
第一作者单位 | 信息科学与技术学院 |
第一作者的第一单位 | 信息科学与技术学院 |
推荐引用方式 GB/T 7714 | 马莹莹,吴幼龙,唐华. 基于特征编码和图嵌入的姓名消歧方法[J]. 中国科学院大学学报,2022,39(3):360-368. |
APA | 马莹莹,吴幼龙,&唐华.(2022).基于特征编码和图嵌入的姓名消歧方法.中国科学院大学学报,39(3),360-368. |
MLA | 马莹莹,et al."基于特征编码和图嵌入的姓名消歧方法".中国科学院大学学报 39.3(2022):360-368. |
条目包含的文件 | ||||||
文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 |
个性服务 |
查看访问统计 |
谷歌学术 |
谷歌学术中相似的文章 |
[马莹莹]的文章 |
[吴幼龙]的文章 |
[唐华]的文章 |
百度学术 |
百度学术中相似的文章 |
[马莹莹]的文章 |
[吴幼龙]的文章 |
[唐华]的文章 |
必应学术 |
必应学术中相似的文章 |
[马莹莹]的文章 |
[吴幼龙]的文章 |
[唐华]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
修改评论
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。