基于特征编码和图嵌入的姓名消歧方法
其他题名Name disambiguation based on encoding attributes and graph topology
2022-05-15
发表期刊中国科学院大学学报
ISSN2095-6134
卷号39期号:3页码:360-368
DOI10.7523/j.ucas.2020.0019
摘要针对作者姓名歧义问题,提出基于特征编码和图嵌入的作者姓名消歧方法.该方法首先利用word2vec模型对文档的属性特征进行编码从而构建文档的表征向量,然后采用图自动编码器将文档关系编码至文档向量中,聚类相似文档.为进一步提升聚类结果的准确性,使用图嵌入的方法将文档关系网络和作者关系网络的拓扑结构信息引入文档向量,进一步聚集相关文档.该方法同时利用文档的属性特征以及多个关系网络的信息,通过无监督学习的方法寻找文档表征向量,实现良好的姓名消歧效果.在真实作者数据集AMiner上的测试结果表明,该方法显著优于目前几个其他基于图网络的方法.
关键词姓名消歧 图神经网络 聚类方法 特征提取 图嵌入
URL查看原文
收录类别北大核心 ; CSCD
语种中文
原始文献类型Periodical
来源库WanFang
中图分类号TP391.1
资助机构国家自然科学基金
文献类型期刊论文
条目标识符https://kms.shanghaitech.edu.cn/handle/2MSLDSTB/256257
专题信息科学与技术学院_硕士生
信息科学与技术学院_PI研究组_吴幼龙组
作者单位
1.上海科技大学信息科学与技术学院,上海201210;
2.中国科学院上海微系统与信息技术研究所,上海200050;
3.中国科学院大学,北京100049
第一作者单位信息科学与技术学院
第一作者的第一单位信息科学与技术学院
推荐引用方式
GB/T 7714
马莹莹,吴幼龙,唐华. 基于特征编码和图嵌入的姓名消歧方法[J]. 中国科学院大学学报,2022,39(3):360-368.
APA 马莹莹,吴幼龙,&唐华.(2022).基于特征编码和图嵌入的姓名消歧方法.中国科学院大学学报,39(3),360-368.
MLA 马莹莹,et al."基于特征编码和图嵌入的姓名消歧方法".中国科学院大学学报 39.3(2022):360-368.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[马莹莹]的文章
[吴幼龙]的文章
[唐华]的文章
百度学术
百度学术中相似的文章
[马莹莹]的文章
[吴幼龙]的文章
[唐华]的文章
必应学术
必应学术中相似的文章
[马莹莹]的文章
[吴幼龙]的文章
[唐华]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。