期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于加权TextRank的新闻关键事件主题句提取 被引量:11
1
作者 蒲梅 周枫 +2 位作者 周晶晶 严馨 周兰江 《计算机工程》 CAS CSCD 北大核心 2017年第8期219-224,共6页
为了在大量的新闻中快速找到自己感兴趣的内容,提出在单文档中基于加权TextRank算法提取主题句的方法,以得到新闻关键事件信息。通过计算新闻文本句子关键词的互信息值,对新闻报道进行事件句和非事件句的分类,过滤出非事件句。基于TextR... 为了在大量的新闻中快速找到自己感兴趣的内容,提出在单文档中基于加权TextRank算法提取主题句的方法,以得到新闻关键事件信息。通过计算新闻文本句子关键词的互信息值,对新闻报道进行事件句和非事件句的分类,过滤出非事件句。基于TextRank算法的思想,构建一个事件句有向图,引入句子位置、句子相似度和关键词覆盖频率3个影响因子,以此计算句子之间的影响权重,利用TextRank模型对图中的每个点计算权重,并选取排序最靠前的句子作为关键事件的主题句。实验结果表明,该方法的抽取效果优于基于词频-逆文档概率和新闻标题的主题句抽取方法。 展开更多
关键词 TextRank算法 子相似度 关键事件 主题句提取 影响权重
在线阅读 下载PDF
基于句子相似度的文本主题句提取算法研究 被引量:12
2
作者 孔胜 王宇 《情报学报》 CSSCI 北大核心 2011年第6期605-609,共5页
文本主题提取是文本挖掘领域的重要研究内容,解决文本信息泛滥的重要手段。为了解决现有文本主题句提取中一些局部主题容易被忽略的问题,本文提出一种"先分割,再提取"的思想。首先将文本表示为句子的线性序列,句子表示为词的线性序列... 文本主题提取是文本挖掘领域的重要研究内容,解决文本信息泛滥的重要手段。为了解决现有文本主题句提取中一些局部主题容易被忽略的问题,本文提出一种"先分割,再提取"的思想。首先将文本表示为句子的线性序列,句子表示为词的线性序列,并对每个句子都预处理为含有实词的词汇链,然后基于知网(Hownet)计算相邻句子相似度。基于句子相似度,采用文本分割技术将文本分为多个关于子主题的句子包,通过句子关系图对这些句子包进行主题句提取。最后选用不同的语料库,设计进行了可接受性测试,实验结果验证该算法是可行、有效地。 展开更多
关键词 子相似度 主题句提取 文本分割 子关系图
在线阅读 下载PDF
面向话题的新闻综述报告自动生成研究 被引量:2
3
作者 路璐 李涓子 +1 位作者 侯磊 张蓝姗 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期194-200,共7页
利用新闻事件的话题、实体及其关联和发展趋势分析,建立对新闻事件分析报告模型。该模型可以从多个角度描述新闻事件,并依照新闻综述报告的写作特点,制定出一种计算机自动分析报告生成的框架,对新闻事件在话题和实体上的分析结果进行组... 利用新闻事件的话题、实体及其关联和发展趋势分析,建立对新闻事件分析报告模型。该模型可以从多个角度描述新闻事件,并依照新闻综述报告的写作特点,制定出一种计算机自动分析报告生成的框架,对新闻事件在话题和实体上的分析结果进行组合,自动生成一篇观点分析透彻、图表信息生动准确的新闻事件分析报告。 展开更多
关键词 新闻综述 话题模型 主题句提取 行文规则
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部