期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
全文本视角下的核心引文测度:概念界定、指标体系与识别模型
1
作者 林歌歌 侯海燕 +2 位作者 潘宇馨 梁国强 胡志刚 《情报学报》 CSSCI CSCD 北大核心 2024年第10期1199-1212,共14页
识别施引文献中的核心引文是深入开展科技成果评价的重要基础。为此,本文探讨了全文本视角下的核心引文测度,包括概念界定、指标体系构建及识别模型的优化,从而提供一个更为精准的科学评价工具。首先,明确核心引文的定义,构建包含题录... 识别施引文献中的核心引文是深入开展科技成果评价的重要基础。为此,本文探讨了全文本视角下的核心引文测度,包括概念界定、指标体系构建及识别模型的优化,从而提供一个更为精准的科学评价工具。首先,明确核心引文的定义,构建包含题录信息和引用信息2个维度、8个子维度及33个引文特征指标的核心引文识别指标体系。其次,通过多种机器学习模型(如随机森林、支持向量机、逻辑回归)对引文特征指标进行遴选与优化,分析其相关性及信息增益,保留21个重要的引文特征指标,并验证识别模型的有效性。研究结果表明,基于引用信息的引文特征指标在识别核心引文时具有更高的重要性和贡献度。机器学习模型在核心引文识别中的表现优异,特别是随机森林、支持向量机、逻辑回归等模型,其ROC (receiver operating characteristic)曲线的AUC (area under curve)值均大于0.85,证明了模型的高效性和鲁棒性。核心引文测度方法及识别模型不仅为科学评价体系提供了更精准的工具,也为深入研究引文分析奠定了坚实的基础。 展开更多
关键词 核心引文 引用信息 题录信息 机器学习 全文引文分析
在线阅读 下载PDF
融合引文内容和全文本引文分析的知识流动研究 被引量:30
2
作者 张艺蔓 马秀峰 程结晶 《情报杂志》 CSSCI 北大核心 2015年第11期50-54,49,共6页
提出将引文内容分析与全文本引文分析相结合的方法,分析知识流动情况,建立三个文献集:施引文献集、原始文献集和参考文献集。通过原始文献集的桥梁作用,利用引用与被引用的关系,将三个文献集联系起来,分别提取三个文献集的主题,探测出... 提出将引文内容分析与全文本引文分析相结合的方法,分析知识流动情况,建立三个文献集:施引文献集、原始文献集和参考文献集。通过原始文献集的桥梁作用,利用引用与被引用的关系,将三个文献集联系起来,分别提取三个文献集的主题,探测出学科内部与学科间知识流动的趋势,证实了提出方法的有效性,可以利用此方法进行知识流动方面的研究,且对于预测学科发展有重要意义。 展开更多
关键词 引文内容分析 全文引文分析 知识流动 LDA模型
在线阅读 下载PDF
融合引用语义和语境特征的作者引文耦合分析法 被引量:5
3
作者 张汝昊 袁军鹏 《情报学报》 CSSCI CSCD 北大核心 2022年第8期796-811,共16页
作者引文耦合分析是发现领域活跃研究社群与知识结构的重要工具。当前该方法主要利用引用次数朴素地表征作者间的联系强度,忽视了耦合双方在更深层次上的相似性。为增强现有方法的可靠性与分析深度,本研究试图利用丰富的全文本资源,挖... 作者引文耦合分析是发现领域活跃研究社群与知识结构的重要工具。当前该方法主要利用引用次数朴素地表征作者间的联系强度,忽视了耦合双方在更深层次上的相似性。为增强现有方法的可靠性与分析深度,本研究试图利用丰富的全文本资源,挖掘引用内容所蕴含的“引了什么”“在何处引”“引用的重要性如何”等关键信息,从施引动机的相似性这一本质层面优化引文耦合强度,提出一种融合引用语义和语境特征的作者引文耦合分析法。该方法通过深入学术论文全文,抽取耦合双方在施引论文中引用内容的语义和语境特征,以此计算增强型引文耦合强度,为每一次引文耦合赋予不同的相似程度值;在此基础上,通过“论文-主题-作者”聚合映射考虑作者的多元兴趣倾向,最终获得作者间的研究主题相似性度量。为证明提出方法的有效性,本研究利用中文“图书情报与数字图书馆”领域的13562篇论文的全文本数据开展了实证研究。实证结果表明,提出方法相较于现有作者引文耦合分析法具有更优的作者兴趣社群发现效果,呈现出更佳、更细致的聚类群落分布,划分出的作者兴趣社群具有更高的群内研究主题同质性和互引概率;此外,提出方法面向大体量作者时的表现更为稳定,具有拓展和应用前景。 展开更多
关键词 作者引文耦合分析 全文引文分析 引文内容分析 引用语义 引用语境 领域知识结构
在线阅读 下载PDF
大规模科技文献深度解析和检索平台构建 被引量:5
4
作者 吴素研 吴江瑞 李文波 《现代情报》 CSSCI 2020年第1期110-115,共6页
[目的/意义]在信息检索、科技论文评价和知识结构演化方面,引文分析都起着至关重要的作用。随着格式化全文数据库的出现,引文分析迈入了4.0时代--全文引文分析阶段。但是,目前还没有中文的格式化全文数据库,这极大地制约了全文引文分析... [目的/意义]在信息检索、科技论文评价和知识结构演化方面,引文分析都起着至关重要的作用。随着格式化全文数据库的出现,引文分析迈入了4.0时代--全文引文分析阶段。但是,目前还没有中文的格式化全文数据库,这极大地制约了全文引文分析在我国科技文献中的研究和应用。[方法/过程]在本文中我们提出建立高效的中文全文引文分析依赖的数据集和检索平台的方法,主要包括:1)提出了基于规则和SVM分类方法的论文元数据和引用提取方法;2)提出基于Spark平台的实现高效引文内容分析标准化数据集生成方法;3)提出建立引用内容的科技文献检索平台。[结果/结论]引文内容分析标准化数据集的建立将全面提升全文引文分析在我国科技领域中的研究效能,提高科技文献查找精度。 展开更多
关键词 全文引文分析 信息抽取 信息检索 SPARK
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部