-
题名基于引文内容的跨文献知识实体共现网络构建与分析
- 1
-
-
作者
聂维民
欧石燕
-
机构
南京大学信息管理学院
-
出处
《现代情报》
北大核心
2025年第9期32-45,共14页
-
基金
国家社会科学基金一般项目“基于时空知识图谱的史书典籍多源知识融合与多维知识重组研究”(项目编号:24BTQ035)。
-
文摘
[目的/意义]目前的共词网络仅能捕获知识实体在同一文献中的关联,难以建模跨文献的知识实体关联,并且缺乏语义信息。此外,现有的跨文献知识实体网络在建模知识实体的跨文献关联等方面仍存在不足。因此,有必要探索更加完善的跨文献知识实体共现网络构建方法。[方法/过程]本文结合引文内容分析的研究成果,提出一种基于施引文本—被引片段对的跨文献知识实体共现网络的构建方法,并通过微观引文重要性来区分知识实体的同文献关联和跨文献关联。随后,本文将构建的跨文献知识实体共现网络与传统共词网络、基于施引文本的知识实体共现网络进行了比较分析。[结果/结论]自然语言处理领域的实证研究表明,本文构建的网络规模更大,知识实体间关联更为丰富,且具有一定的稀疏性和“小世界”特性。在知识实体重要性评估中,基于该类网络的加权度中心性方法蕴含着更丰富的信息,与频次方法具有较高的相关性,且表现出更强的区分能力。通过该网络挖掘的研究主题更为集中凝练。本文综合运用了知识网络、实体计量和引文内容分析等领域的方法,不仅有效推动了这些领域的边界延展与交叉融合,还为相关研究提供了新的方法论支撑。此外,本文对推动科学文献的知识发现与利用、提升研究人员的认知效率具有重要意义。
-
关键词
知识实体
实体计量
知识网络
引文内容分析
共词网络
-
Keywords
knowledge entity
entitymetrics
knowledge network
citation content analysis
co-word network
-
分类号
G254
[文化科学—图书馆学]
-
-
题名科学文献中的知识实体抽取与评价研究综述
被引量:6
- 2
-
-
作者
刘春丽
陈爽
-
机构
中国医科大学图书馆
中国医科大学健康管理学院
-
出处
《现代情报》
CSSCI
2023年第12期143-163,共21页
-
文摘
[目的/意义]科学文献中的知识实体的挖掘、利用与评价对知识发现、构建知识网络、探索知识之间潜在关联均具有重要意义。随着机器学习、深度学习和大语言模型的发展及其应用,相比最早的基于人工标注的知识实体抽取技术,如今已经发生了翻天覆地的变化;此外,近年来,学者对科学文献中知识实体的评价也进行一些探索,取得了较大进展。[方法/过程]在相关文献调研基础上,回顾并比较了基于人工标注的方法、基于规则的方法、传统机器学习、基于深度学习与大语言模型在知识实体抽取方面的优缺点,列举了相关数据集、软件与工具及相关专业会议;从提及频率、替代计量及其影响因素、实体共现网络及实体扩散/引文网络、基于知识实体的同行评议、基于知识实体的论文新颖性和临床转化进展五大方面,对知识实体的评价研究最新进展进行了归纳与整理。[结果/结论]针对目前存在的问题,建议在具体的知识实体抽取任务中,抽取方法选择应权衡多方面因素,再依此选择一个或多个模型完成实体抽取任务;在知识实体评价方面,应重视指标多样化、可靠性、有效性、系统性和规范化研究,关注对知识实体评价指标的影响因素、指标间相关关系与因果关系的实证分析,构建基于知识实体的论文评价指标体系,从细粒度和智能化视角赋能未来的科技评价与应用。
-
关键词
知识实体
实体抽取
实体评价
科学文献
实体计量学
综述
-
Keywords
knowledge entity
entity extraction
entity evaluation
scientific literature
entitymetrics
review
-
分类号
G254
[文化科学—图书馆学]
-