-
题名融合关键信息的科技文献创新点生成方法
被引量:1
- 1
-
-
作者
李宝安
刘翔
王宗辉
吕学强
游新冬
-
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
-
出处
《计算机工程与设计》
北大核心
2023年第4期1267-1273,共7页
-
基金
国家自然科学基金项目(62171043)
北京市自然科学基金项目(4212020)
+2 种基金
国防科技重点实验室基金项目(6412006200404)
北京信息科技大学“勤信人才”培育计划基金项目(QXTCP B201908)
北京市市教委科研计划基金项目(KM202111232001)。
-
文摘
相较传统的阅读方式,利用摘要生成等技术生成文献的创新点存在正确性低、事实准确性差、与原文的关键信息有偏差等问题。据此,提出一种融合关键信息的科技文献创新点生成方法,在该领域构建一个中文长文本-生成创新点语料库,提出一个领域知识抽取方法,用实体知识指导原文内容的选择,利用指针生成网络生成最终的创新点。实验结果表明,该方法在Rouge分数上均优于主流方法,生成的创新点具有更好的正确性和事实准确性。
-
关键词
创新点生成
摘要生成
知识抽取
强化学习
指针网络
事实准确性
语料库构建
-
Keywords
innovation point generation
abstract generation
knowledge extraction
reinforcement learning
pointer network
factual correctness
corpus construction
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于多步句子选择-重写模型生成科技文献创新点
- 2
-
-
作者
许贤哲
陈景强
-
机构
南京邮电大学计算机学院
江苏省大数据安全与智能处理重点实验室(南京邮电大学)
-
出处
《计算机科学》
CSCD
北大核心
2024年第10期344-350,共7页
-
基金
国家自然科学基金(61806101)
江苏省高校自然科学研究项目(21KIB520017)。
-
文摘
近年来科技文献数量的显著增加,使得研究人员难以跟上自己所在领域的最新进展。为了保持对前沿研究的追踪,研究者通常依赖于阅读文献中的创新点,该部分简明扼要地概括了关键研究成果。然而,许多作者在文中并未充分地呈现文章的创新内容,这导致读者难以快速掌握研究的核心内容。为了解决这一问题,提出了一个全新的任务,即自动生成科技文献的创新点摘要。该任务的难点之一在于目前缺少相关数据集,于是构建了科技创新点摘要语料库(SCSC)。另一个难点在于目前现有的生成式或抽取式模型在生成创新点方面分别存在冗余度过高和句与句之前缺乏关联性的问题。为了满足生成简洁、高质量创新点的需求,提出了MSSRsum模型(一个多步句子选择-重写模型)。最终实验表明,所提模型在SCSC和arXiv数据集上优于基线模型。
-
关键词
摘要
科技文献
多步句子选择-重写
生成创新点
-
Keywords
Summarization
Scientific papers
Multi-step sentence selecting-and-rewriting
Generation of contributions
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-