-
题名基于Lex-PageRank的微博摘要优化方法
被引量:1
- 1
-
-
作者
朱明峰
叶施仁
叶仁明
-
机构
常州大学信息工程学院
-
出处
《计算机科学》
CSCD
北大核心
2016年第9期261-265,共5页
-
基金
国家自然科学基金(61272367)资助
-
文摘
当前,由于全民自媒体兴起而引发了巨大的舆情危机,如何高效快速地从海量的碎片化信息中发现热点并抽取实用信息成为一项重大的挑战。在此背景下,提出一种基于Lex-PageRank的微博摘要优化方法,在该方案中,以聚类结果作为实验数据,从微博影响力周期的时间特性和权重属性考虑,提出改进的Lex-PageRank算法,从聚类结果中抽取若干文本组织生成摘要。在新浪微博数据基础上进行的对比实验表明,本方案可以有效地从大量文本中提取出关键信息。
-
关键词
微博
时间特性
权重属性
Lex-PageRank算法
-
Keywords
Microblog,Time characteristics,Weight attribute,Lex-PageRank algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名词句协同自动摘要提取方法
被引量:2
- 2
-
-
作者
吴云
杨长春
梅佳俊
顾寰
-
机构
常州大学信息工程学院
-
出处
《计算机工程与设计》
北大核心
2018年第9期2776-2779,2810,共5页
-
基金
赛尔网络下一代互联网技术创新基金项目(NGII20160703)
-
文摘
为提高自动文摘的质量,提出一种词句协同的自动摘要提取算法(F-CoRank)。在传统词频的基础上,提高与标题相似的特征词的词频,得出提高后的词频矩阵和句子之间的相似度后,构建无向网络图,根据词句协同算法,得到各个节点的权重,对得到的粗文摘进行冗余处理,根据相应的需求,选择权重较高的前几个句子作为摘要。在哈工大的单文本文档语料上进行实验,实验结果表明,提高词频权重在一定程度上改进了文摘的质量,相比词句协同算法(Co-Rank)在覆盖率上有了较大提高。
-
关键词
词权重
标题
词句协同
单文本文档
覆盖率
-
Keywords
word weight
title
word-sentence co-ranking
single document
coverage
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-