期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
面向网络演化信息的动态文摘方法研究 被引量:8
1
作者 张瑾 许洪波 程学旗 《计算机学报》 EI CSCD 北大核心 2008年第4期696-701,共6页
随着互联网的发展和Web2.0的出现,网络信息内容的动态演化性越来越明显.该文从网络信息的时间演化性出发,给出了动态文摘的形式化定义.在分析当前信息与历史信息的演化关系的基础上,采用内容过滤的方法度量演化内容的差异性,从而得到三... 随着互联网的发展和Web2.0的出现,网络信息内容的动态演化性越来越明显.该文从网络信息的时间演化性出发,给出了动态文摘的形式化定义.在分析当前信息与历史信息的演化关系的基础上,采用内容过滤的方法度量演化内容的差异性,从而得到三种动态文摘模型,并基于模糊隶属度给出了具体的动态文摘生成方法.在DUC2007测试数据上的实验,证明了文中所提出动态文摘模型及生成方法的有效性. 展开更多
关键词 动态演化性 动态文摘 模型 性能
在线阅读 下载PDF
基于Topic Signature的动态文摘更新方法 被引量:2
2
作者 张祯 樊兴悦 +1 位作者 郭禹田 吴国华 《计算机工程》 CAS CSCD 北大核心 2018年第6期169-175,共7页
目前针对动态文摘的研究关注对象主要是多文档集合,其中内容随时间而更新演化,但动态文摘中存在高冗余、新颖信息丢失等问题,会影响文摘提取质量。为此,研究Topic Signature模型,并在其基础上提出一种新的整数规划动态文摘更新方法。根... 目前针对动态文摘的研究关注对象主要是多文档集合,其中内容随时间而更新演化,但动态文摘中存在高冗余、新颖信息丢失等问题,会影响文摘提取质量。为此,研究Topic Signature模型,并在其基础上提出一种新的整数规划动态文摘更新方法。根据句间相似度对每条语句的主题代表性和信息多样性进行评分,利用Topic Signature模型评估语句的新颖性,以提取事件中的更新演进信息。在此基础上,依据摘要生成策略,缩小解的可行域,以保证在短时间内生成高质量的文摘。实验结果表明,该方法无需进行模型训练和语言匹配,能够有效降低时间复杂度,提高文摘提取效率。 展开更多
关键词 动态文摘 TOPIC Signature模型 密度峰值 整数规划模型 自然语言处理
在线阅读 下载PDF
中文文本挖掘的动态文摘建模方法 被引量:1
3
作者 刘美玲 王慧强 +1 位作者 陈广胜 于洋 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2019年第4期820-826,共7页
中文文摘是自然语言处理领域的重要研究之一,尤其是基于理解的文摘中对时间特征的研究,更是引起了广泛的关注。本文抽取中文文本摘要的动态特征,进行文本挖掘和建模分析来体现时间特性。通过对中文动态多文档文摘系统框架和句子加权、... 中文文摘是自然语言处理领域的重要研究之一,尤其是基于理解的文摘中对时间特征的研究,更是引起了广泛的关注。本文抽取中文文本摘要的动态特征,进行文本挖掘和建模分析来体现时间特性。通过对中文动态多文档文摘系统框架和句子加权、特征抽取及句子选择等关键步骤的算法设计,实现动态文摘模型,并提出基于动态性能的中文文摘评测方法。实验证明该中文动态文摘技术及其评测算法在实际的文本挖掘过程中,能较好地获得可理解性的、具有时间延展性的摘要,具有一定的可行性和较高的研究价值。 展开更多
关键词 动态文摘 建模 文本挖掘 文摘 评测方法 句子加权 文本理解 语料测试
在线阅读 下载PDF
相似度质心多层过滤策略的动态文摘方法
4
作者 于洋 范文义 +1 位作者 刘美玲 王慧强 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2014年第10期1236-1241,共6页
为了研究网络快速有效获取信息的方法,网络动态演化内容的识别和分析成为人们迫切需要解决的关键问题。动态多文档文摘建立在时间信息基础上,从网络数据的动态性能入手,对同一主题不同时段的文摘集合进行分析,在识别信息内容差异性的基... 为了研究网络快速有效获取信息的方法,网络动态演化内容的识别和分析成为人们迫切需要解决的关键问题。动态多文档文摘建立在时间信息基础上,从网络数据的动态性能入手,对同一主题不同时段的文摘集合进行分析,在识别信息内容差异性的基础上,对信息的动态演化性进行建模。在提出相似度累加模型基础上,进一步提出了基于质心整体选优的动态文摘模型。分析当前文档集合与历史集合强关联性,以选择出的不同文摘句为首句生成候选文摘集合,然后根据质心多层过滤优选方法从中选出最优文摘结果。这种模型方法消除了因首句选择不当而对文摘性能造成的影响,在国际标准评测Taxt Anynasis Conference 2008的Update task任务语料上进行了测试,并且获得了较好的实验结果。 展开更多
关键词 动态文摘模型 质心整体选优 相似度累加模型
在线阅读 下载PDF
基于增量图聚类的动态多文档摘要算法 被引量:2
5
作者 郭海蓉 张晖 +2 位作者 赵旭剑 李波 杨春明 《计算机应用研究》 CSCD 北大核心 2016年第7期2034-2038,共5页
目前的动态文摘方法几乎都基于文档批处理机制,无法适应实际应用中表现为不稳定数据流的文档数据,因此无法满足实时更新摘要的需求。针对上述问题,提出了一种基于K近邻句子图模型的动态文本摘要方法。根据K近邻规则构建一个双层句子图模... 目前的动态文摘方法几乎都基于文档批处理机制,无法适应实际应用中表现为不稳定数据流的文档数据,因此无法满足实时更新摘要的需求。针对上述问题,提出了一种基于K近邻句子图模型的动态文本摘要方法。根据K近邻规则构建一个双层句子图模型,用基于密度划分的增量图聚类方法对句子进行子主题划分,最后结合时间因素提高句子新颖度来抽取动态文摘。该方法能基于文档数据流增量式地抽取动态文摘,实现文摘内容的实时更新。在TAC2008和TAC2009的update summarization数据集上的实验结果显示了该方法在动态文摘抽取上的有效性。 展开更多
关键词 动态文摘 K近邻 句子图模型 增量图聚类
在线阅读 下载PDF
基于子主题增强的演化式多文档摘要生成 被引量:1
6
作者 江璐璐 胡珀 贝超 《计算机工程》 CAS CSCD 北大核心 2018年第7期172-176,共5页
可帮助用户获取感兴趣的新闻话题发展轨迹,但现有研究中大多仅考虑句子间的关系来对句子进行打分排序,忽视了文档主题层面的信息影响。为此,提出一种新的基于子主题增强的摘要算法。考虑句子间的关系,分析每个时间段内的子主题对句子的... 可帮助用户获取感兴趣的新闻话题发展轨迹,但现有研究中大多仅考虑句子间的关系来对句子进行打分排序,忽视了文档主题层面的信息影响。为此,提出一种新的基于子主题增强的摘要算法。考虑句子间的关系,分析每个时间段内的子主题对句子的影响,使得与重要子主题越相关的句子得分越高,通过句子与子主题的互强化来对句子进行主题层面的综合打分排序。实验结果表明,与现有的时间轴摘要算法相比,该算法可移植性较好,且可准确获取新闻演化轨迹。 展开更多
关键词 静态文摘 动态演化文摘 层次狄利克雷过程 子主题 时间轴摘要
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部