-
题名面向特定科研任务的著者姓名消歧方法
被引量:5
- 1
-
-
作者
吴柯烨
闵超
孙建军
权昭瑄
-
机构
南京大学信息管理学院
南京大学人文社会科学大数据研究院
-
出处
《情报学报》
CSSCI
CSCD
北大核心
2021年第7期734-744,共11页
-
基金
教育部人文社会科学基金项目“施引群体视角的科学产出评价方法研究”(19YJC870017)
国家自然科学基金项目“引文模式视角下的科学突破研究”(71904081),“引文扩散理论及实证研究”(71874077)。
-
文摘
人才流动、学者评价等以学者个人为对象的研究任务,通常需要针对学术论著数据集中的著者进行姓名消歧。本文针对此类特定研究任务,提出了准确且便于学者操作的姓名消歧方法。为简便计算,弥补本地数据缺失的问题,本文构建了基于异源数据的二阶段姓名消歧框架。一阶段充分挖掘本地关联信息,二阶段结合权威的外源数据。基于表征进行本地关系发现、半模糊检索等步骤,以达到全面客观的姓名消歧,最终通过人工智能领域的论文数据和Aminer姓名消歧数据集,实现并验证该方法的优越性和普适性。经过与人工标注数据对比,该框架表现出良好的消歧效果,较好地解决了原始数据中的同名异人和同人异名问题,从而为后续研究任务奠定了扎实的基础。
-
关键词
特定研究任务
二阶段姓名消歧
异源数据
关系发现
半模糊检索
-
Keywords
specific research task
two-stage name disambiguation
heterogeneous data
associated information extraction
semi-fuzzy retrieval
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-