-
题名一种基于LexRank算法的改进的自动文摘系统
被引量:15
- 1
-
-
作者
纪文倩
李舟军
巢文涵
陈小明
-
机构
北京航空航天大学计算机学院
-
出处
《计算机科学》
CSCD
北大核心
2010年第5期151-154,218,共5页
-
基金
国家自然科学基金项目(60573057
60473057
90604007)资助
-
文摘
自动文摘是计算机语言学领域的一个研究重点,其研究和应用受到了计算机科学、语言学、情报信息学等相关学科的广泛关注。首先介绍了基于LexRank算法的自动文摘方法。针对该方法的不足,从句子相似度计算方法、句子权重计算方法以及冗余处理等方面对它进行了改进,从而可以根据输入文本内容动态地调整相关影响因子。实现的文摘系统,可以对中文和英文的单文本或多文本进行自动文摘。在哈工大和DUC的测评语料上进行了实验,结果表明该系统在一定程度上改进了文摘的质量,在多文本文摘中的抗噪声方面也有一定的优越性。最后讨论了自动摘要研究存在的问题,并指出了自动文摘的研究趋势。
-
关键词
自动文摘
LexRank
句子相似度
动态调整
冗余处理
-
Keywords
automatic abstracting LexRank sentence similarity Dynamic adjustment redundancy resolution
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于语句类似度优化计算的改进自动摘要算法研究
被引量:3
- 2
-
-
作者
高雪霞
贾海龙
-
机构
新乡学院计算机与信息工程学院河南新乡
新乡学院现代教育技术中心河南新乡
-
出处
《计算机应用与软件》
CSCD
北大核心
2013年第9期160-162,182,共4页
-
基金
河南省科技厅基础与前沿技术研究类重点项目(112300410266)
河南省科技厅基础与前沿技术研究类重点项目(112300410262)
-
文摘
计算语句的类似度在自动问答、机器翻译、信息检索和自动摘要等算法中有着非常重要的作用。首先归纳了语句类似度计算的方法,综合考虑关键词特征、语义特征、句式特征和语句长度特征等信息并提出一种优化语句类似度计算方法,以语句权重计算方法以及冗余处理优化处理为基础,实现一个改进的自动摘要算法。通过在DUC的测评语料上进行仿真,实验结果证明了该算法对于摘要质量优化的高效性。最后,讨论了自动摘要研究存在的问题,并指出自动摘要的研究趋势。
-
关键词
语句类似度
自动摘要
语句权重计算
冗余处理
-
Keywords
sentence similarity automatic abstracting sentence-weight computing redundancy resolution
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-