-
题名一种基于主题词集的自动文摘方法
被引量:6
- 1
-
-
作者
刘兴林
郑启伦
马千里
-
机构
华南理工大学计算机科学与工程学院
五邑大学计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2011年第4期1322-1324,共3页
-
基金
广东省自然科学基金资助项目(9451064101003233)
华南理工大学中央高校基本科研业务费专项资金资助项目(2009ZM0125
+1 种基金
2009ZM0189
2009ZM0255)
-
文摘
提出一种基于主题词集的文本自动文摘方法,用于自动提取文档文摘。该方法根据提取到的主题词集,由主题词权重进行加权计算各主题词所在的句子权重,从而得出主题词集对应的每个句子的总权重,再根据自动文摘比例选取句子权重较大的几个句子,最后按原文顺序输出文摘。实验在哈工大信息检索研究室单文档自动文摘语料库上进行,使用内部评测自动评估方法对获得的文摘进行评价,总体F值达到了66.07%。实验结果表明,该方法所获得的文摘质量高,较接近于参考文摘,取得了良好的效果。
-
关键词
自动文摘
主题词集
句子权重
自然语言处理
-
Keywords
automatic summarization
thematic term set
sentence weight
NLP
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于改进情感关键句抽取的自动情感摘要技术
被引量:3
- 2
-
-
作者
李宪毅
刘培玉
朱振方
侯秀艳
刘祥哲
-
机构
山东师范大学信息科学与工程学院
山东师范大学山东省分布式计算机软件新技术重点实验室
山东交通学院信息科学与电气工程学院
-
出处
《计算机工程与设计》
北大核心
2016年第3期778-782,共5页
-
基金
国家自然科学基金项目(61373148
61502151)
+5 种基金
国家社科基金项目(12BXW040)
山东省自然科学基金项目(ZR2012FM038
ZR2014FL010)
山东省优秀中青年科学家奖励基金项目(BS2013DX033)
教育部人文社科基金项目(14YJC860042)
山东省社科规划基金项目(12BXWJ01)
-
文摘
为解决现阶段文本情感摘要方法缺乏的问题,提出一种基于改进情感关键句抽取的情感摘要生成技术。利用TFISF抽取文章的关键词,分析句子包含关键词数量,采用情感词典对句子进行情感程度分析,通过余弦相似度考察句子与主题的相关性,实现情感关键句的抽取并应用到情感摘要中。实验结果表明,该技术考虑了句子中的关键词属性、情感属性以及主题相关性,能够提高情感摘要的准确率。
-
关键词
情感关键句
主题相关性
情感摘要
句子权重
自动文摘
-
Keywords
sentiment key sentence
topic relevance
sentiment abstract
weight of sentence
automatic abstract
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于改进TextRank的文本摘要自动提取
被引量:15
- 3
-
-
作者
汪旭祥
韩斌
高瑞
陈鹏
-
机构
江苏科技大学计算机学院
-
出处
《计算机应用与软件》
北大核心
2021年第6期155-160,共6页
-
文摘
TextRank算法在自动提取中文文本摘要时只考虑句子间的相似性,而忽略了词语间的语义相关信息及文本的重要全局信息。对此,提出一种基于改进TextRank的文本摘要自动提取算法(SW-TextRank)。通过Word2Vec训练的词向量来计算句子之间的相似度,并综合考虑句子位置、句子与标题的相似度、关键词的覆盖率、关键句子以及线索词等影响句子权重的因素,从而优化句子权重;对得到的候选摘要句群进行冗余处理,选取适量排序靠前的句子并根据其在原文中的顺序重新排列得到最终文本的摘要。实验结果表明,SW-TextRank算法生成摘要的准确性比TextRank算法更高,摘要生成质量更好。
-
关键词
文本摘要
SW-TextRank算法
词向量
相似度
句子权重
-
Keywords
Text summary
SW-TextRank algorithm
Word vector
Similarity
Sentence weight
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于完全稀疏主题模型的多文档自动摘要
被引量:1
- 4
-
-
作者
邵洲
张晖
-
机构
西南科技大学计算机科学与技术学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2014年第3期1032-1036,共5页
-
基金
四川省教育厅基金项目(12ZB326)
绵阳市网络融合实验室基金项目(12ZXWK04)
西南科技大学博士基金项目(12zx7116)
-
文摘
为了解决稀疏情况下的自动文档摘要问题,将提出的完全稀疏主题模型引入到文档摘要中。根据模型中主题分布和主题的词汇分布,提出了该模型上的自动摘要算法。为了验证该方法的有效性,在DUC 2007数据集上使用ROUGE自动摘要评测工具进行评测。通过与DUC 2007中专家摘要和对多种实验的比较,比较结果表明,该摘要方法在准确率上显著优于其它方法,同时在推断时间、方法的简单性等各个方面也都具有优势。
-
关键词
完全稀疏主题模型
多文档摘要
稀疏性
句子权重计算
DUC
2007
-
Keywords
fully sparse topic models
multi-document summary
sparsity
sentence weight calculation
DUC 2007
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-