期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于主题区域发现的中文自动文摘研究 被引量:5
1
作者 胡珀 何婷婷 姬东鸿 《计算机科学》 CSCD 北大核心 2005年第1期177-181,共5页
自动文摘是自然语言处理领域的一项重要的研究课题。文中提出了一种基于主题区域发现的中文自动文摘的方法。该方法的特色在于:产生的文摘能在尽可能全面地覆盖全文多个主题的同时,显著地缩减自身的冗余,从而能有效地平衡两者之间的矛... 自动文摘是自然语言处理领域的一项重要的研究课题。文中提出了一种基于主题区域发现的中文自动文摘的方法。该方法的特色在于:产生的文摘能在尽可能全面地覆盖全文多个主题的同时,显著地缩减自身的冗余,从而能有效地平衡两者之间的矛盾。通过采用K-medoids的聚类算法联同新的自定义目标函数的聚类分析方法,实现了段落自适应聚类下的文本潜在主题区域的发现及其在自动文摘领域的应用。此外,一种基于表达熵的新的评价因子被用来评价摘要的冗余。实验结果验证了该方法的可行性,有效性,是对中文自动文摘研究的一种有意义的探索。 展开更多
关键词 主题区域发现 中文自动文摘 聚类分析 表达熵 文本检索
在线阅读 下载PDF
面向特定领域的理解型中文自动文摘系统 被引量:14
2
作者 李蕾 钟义信 郭祥昊 《计算机研究与发展》 EI CSCD 北大核心 2000年第4期493-497,共5页
自动文摘是计算机通信网提供智能业务的关键技术之一 .介绍了一个面向特定领域——神经网络学习算法的理解型中文自动文摘系统 .与其他文摘系统相比 ,该系统首次采用了基于全信息模型的自然语言理解理论 ,通过设计义块组配的方法避开了... 自动文摘是计算机通信网提供智能业务的关键技术之一 .介绍了一个面向特定领域——神经网络学习算法的理解型中文自动文摘系统 .与其他文摘系统相比 ,该系统首次采用了基于全信息模型的自然语言理解理论 ,通过设计义块组配的方法避开了传统的语法语义分析系统所遇到的各种难题 ,并通过语用信息制导 ,将语句理解与文摘信息提取直接相连 ,大大提高了理解的效率和文摘生成的速度 .测试结果表明该系统的整套方法是行之有效的 . 展开更多
关键词 中文自动文摘系统 计算机通信网 全信息词典
在线阅读 下载PDF
一种基于统计的中文自动文摘方法 被引量:3
3
作者 刘楚达 孙海涛 《湖南农业大学学报(自然科学版)》 CAS CSCD 北大核心 2001年第6期488-490,共3页
为开发出实现容易、成本低、实用性强的计算机中文自动文摘系统 ,经过研究 ,设计了一个基于统计的中文自动文摘系统模型 ,提出了一种新的特征词加权函数和一种新的句子重要性加权函数 ,该系统能对任意领域、任意体裁、任意长度的文章以... 为开发出实现容易、成本低、实用性强的计算机中文自动文摘系统 ,经过研究 ,设计了一个基于统计的中文自动文摘系统模型 ,提出了一种新的特征词加权函数和一种新的句子重要性加权函数 ,该系统能对任意领域、任意体裁、任意长度的文章以任意比例提取文摘 . 展开更多
关键词 自然语言处理 汉语自动分词 词频统计 中文自动文摘系统 计算机应用
在线阅读 下载PDF
主题信息的中文多文档自动文摘系统 被引量:5
4
作者 王红玲 张明慧 周国栋 《计算机工程与应用》 CSCD 2012年第25期132-136,共5页
多文档自动文摘能够帮助人们自动、快速地获取信息,使用主题模型构建多文档自动文摘系统是一种新的尝试,其中主题模型采用浅层狄利赫雷分配(LDA)。该模型是一个多层的产生式概率模型,能够检测文档中的主题分布。使用LDA为多文档集合建模... 多文档自动文摘能够帮助人们自动、快速地获取信息,使用主题模型构建多文档自动文摘系统是一种新的尝试,其中主题模型采用浅层狄利赫雷分配(LDA)。该模型是一个多层的产生式概率模型,能够检测文档中的主题分布。使用LDA为多文档集合建模,通过计算句子在不同主题上的概率分布之间的相似度作为句子的重要度,并根据句子重要度进行文摘句的抽取。实验结果表明,该方法所得到的文摘性能优于传统的文摘方法。 展开更多
关键词 中文自动文摘 浅层狄利赫雷分配(LDA) 主题模型 多文档
在线阅读 下载PDF
面向冗余度控制的中文多文档自动文摘 被引量:6
5
作者 王红玲 周国栋 朱巧明 《中文信息学报》 CSCD 北大核心 2012年第2期92-96,共5页
多文档自动文摘能够帮助人们自动、快速地获取信息,是目前的一个研究热点。相比于单文档自动文摘,多文档自动文摘需要更多考虑文档之间的相关性,以及文档信息之间的冗余性。因此如何控制信息冗余是多文档自动文摘的一个关键所在。该文... 多文档自动文摘能够帮助人们自动、快速地获取信息,是目前的一个研究热点。相比于单文档自动文摘,多文档自动文摘需要更多考虑文档之间的相关性,以及文档信息之间的冗余性。因此如何控制信息冗余是多文档自动文摘的一个关键所在。该文在考虑文摘特性的基础上提出了一个冗余度控制模型,该模型通过计算文本单元在主题概率分布之间的相似度来决定句子的选择,从而达到控制冗余的目的。实验结果表明,该方法能够有效降低冗余度,且总体性能优于现有的自动文摘系统。 展开更多
关键词 冗余度控制 多文档自动文摘 中文自动文摘
在线阅读 下载PDF
基于Siamese LSTM的中文多文档自动文摘模型 被引量:3
6
作者 龚永罡 王嘉欣 +1 位作者 廉小亲 裴晨晨 《计算机应用与软件》 北大核心 2021年第3期287-290,326,共5页
在文本信息数量迅速增长的环境下,为提升阅读效率,提出一种基于深度学习的多文档自动文本摘要模型。在传统文摘模型的基础上将Siamese LSTM深度学习网络应用到文本相似度计算中,计算曼哈顿距离来表征文本相似度,并采用去除停用词的方法... 在文本信息数量迅速增长的环境下,为提升阅读效率,提出一种基于深度学习的多文档自动文本摘要模型。在传统文摘模型的基础上将Siamese LSTM深度学习网络应用到文本相似度计算中,计算曼哈顿距离来表征文本相似度,并采用去除停用词的方法改进该网络模型以提升计算效率。实验结果表明,使用Siamese LSTM与传统余弦相似度等方法相比,生成的文摘在语义方面更贴近主题,质量更高,整个文摘系统的工作效率也显著提升。 展开更多
关键词 中文自动文摘 Siamese LSTM 自然语言处理 深度学习
在线阅读 下载PDF
基于篇章修辞结构的自动文摘连贯性研究 被引量:3
7
作者 刘凯 王红玲 《中文信息学报》 CSCD 北大核心 2019年第1期77-84,共8页
尽管抽取式自动文摘方法是目前自动文摘领域的主流方法,并且取得了长足的进步,但抽取式自动文摘形成的摘要由于缺乏句子之间的合理指代或篇章结构,使得文摘缺乏连贯性而影响可读性。为提高自动摘要的可读性,该文尝试将篇章修辞结构信息... 尽管抽取式自动文摘方法是目前自动文摘领域的主流方法,并且取得了长足的进步,但抽取式自动文摘形成的摘要由于缺乏句子之间的合理指代或篇章结构,使得文摘缺乏连贯性而影响可读性。为提高自动摘要的可读性,该文尝试将篇章修辞结构信息应用于中文自动文摘。首先,基于汉语篇章修辞结构抽取摘要,然后使用基于LSTM的方法对文本连贯性进行建模,并使用该模型对文摘的连贯性做出评价。实验结果表明:在摘要抽取方面,基于篇章修辞结构的自动文摘相比于传统的抽取方法具有更好的ROUGE评价值;在使用基于LSTM连贯性模型评价摘要连贯性方面,篇章结构信息在自动抽取文摘时可以很好地提炼出文章的主旨,同时使摘要具有更好的结果。 展开更多
关键词 篇章修辞结构 中文自动文摘 连贯性 可读性 实体网格模型 LSTM
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部