-
题名科研论文的可比性评估与比较性引文生成方法
- 1
-
-
作者
李翔宇
陈景强
-
机构
南京邮电大学计算机学院
江苏省大数据安全与智能处理重点实验室(南京邮电大学)
-
出处
《计算机应用》
北大核心
2025年第6期1888-1894,共7页
-
基金
国家自然科学基金青年科学基金资助项目(62102192)。
-
文摘
针对比较性引文生成中面临的两大挑战——准确判定论文间的可比性及生成具有比较性的句子,提出科研论文的可比性评估(CA)与比较性引文生成方法SciCACG(Scientific Comparability Assessment and Citation Generation)。该方法构建了3个核心模块:用于判断2篇论文是否具备可比性的CA模块、负责从论文与参考文献中抽取出具体的比较对象的比较对象抽取(CE)模块和用于生成相应的比较性引用句子的比较引文生成模块。首先,利用SciBERT(Scientific BERT)模型处理输入的2篇文章,并通过CA模块进行可比性的评估;其次,对于被判定为可比的文章,采用CE模块识别并抽取出关键的比较对象;最后,使用比较引文生成模块生成包含这些比较对象的比较性引文。实验结果显示,在CA阶段,所提方法在平均倒数排名(MRR)上达到了0.532,在召回率@10(R@10)上达到了0.731,较之前的SciBERT-FNN(Scientific Bidirectional Encoder Representations from Transformers-Feedforward Neural Network)方法在各个数据集上均有提升;在比较性引文生成中,相较于次优的BART-Large(Bidirectional and Auto-Regressive Transformers-Large)方法,所提方法的ROUGE(Recall-Oriented Understudy for Gisting Evaluation)-1、ROUGE-2和ROUGE-L的F1分数分别提高了1.90、1.29和2.55个百分点。此外,实验结果验证了科学文献自动化比较与分析技术对引文句子生成任务具有重要意义,特别是在提高比较信息的可追溯性和确保引用句子信息的全面性方面,展现出极大的实用价值。
-
关键词
比较性引文
可比性评估
引文生成
文本生成
文本分类
比较对象抽取
-
Keywords
comparative citation
Comparability Assessment(CA)
citation generation
text generation
text classification
Comparison object Extraction(CE)
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-