期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
融合多特征的TextRank关键词抽取方法 被引量:33
1
作者 李航 唐超兰 +1 位作者 杨贤 沈婉婷 《情报杂志》 CSSCI 北大核心 2017年第8期183-187,共5页
[目的/意义]关键词提取在自然语言处理领域有着广泛的应用,如何快速准确地实现关键词的提取已经成为文本处理的关键问题。目前关键词提取方法非常多,但准确率仍有待提升。为此,提出一种结合单一文档内部结构信息、词语对于单文档和文档... [目的/意义]关键词提取在自然语言处理领域有着广泛的应用,如何快速准确地实现关键词的提取已经成为文本处理的关键问题。目前关键词提取方法非常多,但准确率仍有待提升。为此,提出一种结合单一文档内部结构信息、词语对于单文档和文档集整体的重要性的关键词抽取方法。[方法/过程]首先,根据词语的平均信息熵特征计算词语对文档集整体的重要性,利用词语的词性、位置特征计算词语对单文档中的重要性。然后,通过神经网络训练的方式优化三个特征的权重分配实现特征的融合。最后,利用三个特征计算得到词语的综合权值来改进TextRank模型词汇节点的初始权重以及概率转移矩阵,再通过迭代法实现关键词的抽取。[结果 /结论]该研究方法结合了文档集整体信息和单文档自身信息,其关键词提取的准确率较传统TextRank方法、TFIDF-TextRank方法有了明显的提高。 展开更多
关键词 textrank算法 关键词抽取 神经网络 平均信息熵
在线阅读 下载PDF
基于加权TextRank的新闻关键事件主题句提取 被引量:11
2
作者 蒲梅 周枫 +2 位作者 周晶晶 严馨 周兰江 《计算机工程》 CAS CSCD 北大核心 2017年第8期219-224,共6页
为了在大量的新闻中快速找到自己感兴趣的内容,提出在单文档中基于加权TextRank算法提取主题句的方法,以得到新闻关键事件信息。通过计算新闻文本句子关键词的互信息值,对新闻报道进行事件句和非事件句的分类,过滤出非事件句。基于TextR... 为了在大量的新闻中快速找到自己感兴趣的内容,提出在单文档中基于加权TextRank算法提取主题句的方法,以得到新闻关键事件信息。通过计算新闻文本句子关键词的互信息值,对新闻报道进行事件句和非事件句的分类,过滤出非事件句。基于TextRank算法的思想,构建一个事件句有向图,引入句子位置、句子相似度和关键词覆盖频率3个影响因子,以此计算句子之间的影响权重,利用TextRank模型对图中的每个点计算权重,并选取排序最靠前的句子作为关键事件的主题句。实验结果表明,该方法的抽取效果优于基于词频-逆文档概率和新闻标题的主题句抽取方法。 展开更多
关键词 textrank算法 句子相似度 关键事件 主题句提取 影响权重
在线阅读 下载PDF
基于TextRank算法的未知网络协议帧定位方法 被引量:1
3
作者 刘治国 宋广跃 +1 位作者 蔡文珠 刘庆利 《计算机工程》 CAS CSCD 北大核心 2020年第7期179-184,共6页
针对未知网络环境下比特流形式的通信数据难以进行帧定界的问题,提出一种基于TextRank算法的帧定位方法。通过统计数据中的序列出现频率获得比特流中的节点权重,利用基于TextRank的BitstreamRank算法确定未知协议数据中的关键序列,并根... 针对未知网络环境下比特流形式的通信数据难以进行帧定界的问题,提出一种基于TextRank算法的帧定位方法。通过统计数据中的序列出现频率获得比特流中的节点权重,利用基于TextRank的BitstreamRank算法确定未知协议数据中的关键序列,并根据关键序列对比特流进行切分并计算得到各段比特流间的序列相似度,从而定位未知协议数据的帧头位置。仿真结果表明,该方法能实现未知网络协议数据的快速分析,准确定位出比特流数据中各帧的位置,并且帧定位准确率高于90%。 展开更多
关键词 帧定位 textrank算法 序列统计 序列相似度 模式匹配
在线阅读 下载PDF
Title加TextRank抽取关键句的情感分类研究 被引量:6
4
作者 郑诚 钱改林 章金平 《计算机工程与应用》 CSCD 北大核心 2019年第20期95-100,共6页
考虑到不同句子对判断文档情感倾向的重要程度不同,因而区分文档的关键句和细节句将有助于提高情感分类的性能。同时,考虑到Title 和上下文信息,提出了一种基于Title 和加权TextRank 抽取关键句的情感分析方法SKTT,实现了高效的情感分... 考虑到不同句子对判断文档情感倾向的重要程度不同,因而区分文档的关键句和细节句将有助于提高情感分类的性能。同时,考虑到Title 和上下文信息,提出了一种基于Title 和加权TextRank 抽取关键句的情感分析方法SKTT,实现了高效的情感分析。根据文档Title 的情感权重计算Title 贡献度,考虑到标点和语义规则对情感倾向的影响;根据加权TextRank 算法思想,在文档正文中构建了一个情感句有向图来提取关键句;计算所有关键句的情感倾向进行情感分类。在4 个领域上进行实验,实验结果表明,该SKTT方法性能明显优于Baseline,具有高效性。 展开更多
关键词 TITLE textrank 算法 关键句 情感分类 语义规则
在线阅读 下载PDF
基于语义增强的虚假新闻检测
5
作者 成雪 张琛 李清旭 《计算机应用与软件》 北大核心 2025年第2期202-209,共8页
针对将虚假新闻检测抽象为文本分类任务时,可能会忽略新闻文本语义信息的问题,提出一种语义增强的虚假新闻检测方法。使用TextRank算法提取真假新闻的关键词,并融入原始文本中进行信息增强,利用ERNIE模型学习知识增强的语义表示,通过CN... 针对将虚假新闻检测抽象为文本分类任务时,可能会忽略新闻文本语义信息的问题,提出一种语义增强的虚假新闻检测方法。使用TextRank算法提取真假新闻的关键词,并融入原始文本中进行信息增强,利用ERNIE模型学习知识增强的语义表示,通过CNN模型提取新闻文本局部特征,并输入到BiGRU学习序列特征,同时引入注意力机制突出关键特征词,在分类前将特征向量与知识增强的语义表示进行融合,实现虚假新闻检测。实验结果表明,该方法能够有效分类真假新闻,在虚假新闻检测任务中比常用方法准确率有显著提升。 展开更多
关键词 虚假新闻检测 textrank算法 信息增强 ERNIE 语义增强
在线阅读 下载PDF
基于改进TextRank算法的中文文本摘要提取 被引量:26
6
作者 徐馨韬 柴小丽 +2 位作者 谢彬 沈晨 王敬平 《计算机工程》 CAS CSCD 北大核心 2019年第3期273-277,共5页
为提高中文文本摘要提取的准确度,融合Doc2Vec模型、K-means算法和TextRank算法,提出一种中文文本摘要自动提取算法(DK-TextRank)。使用Doc2Vec模型进行文本向量化,采用改进的K-means算法实现相似文本聚类,在每个聚类簇中应用加入权重... 为提高中文文本摘要提取的准确度,融合Doc2Vec模型、K-means算法和TextRank算法,提出一种中文文本摘要自动提取算法(DK-TextRank)。使用Doc2Vec模型进行文本向量化,采用改进的K-means算法实现相似文本聚类,在每个聚类簇中应用加入权重影响因子的TextRank算法对文本语句进行排序,并提取主题句生成摘要。实验结果表明,DK-TextRank算法在摘要语句数量为7时F值达到79.36%,相比传统TF-IDF、TextRank算法提取的摘要质量更高。 展开更多
关键词 Doc2Vec模型 K-MEANS算法 textrank算法 摘要提取 权重影响因子
在线阅读 下载PDF
基于改进TextRank的铁路文献关键词抽取算法 被引量:18
7
作者 赵占芳 刘鹏鹏 李雪山 《北京交通大学学报》 CAS CSCD 北大核心 2021年第2期80-86,共7页
实现铁路行业海量的铁路科技信息资源有效地组织管理并提供智能化、专业化的检索和服务,已经成为科研人员迫切期望解决的问题.关键词自动抽取技术是实现信息的智能检索和标引分类的核心技术,本文提出了一种改进TextRank的关键词抽取算... 实现铁路行业海量的铁路科技信息资源有效地组织管理并提供智能化、专业化的检索和服务,已经成为科研人员迫切期望解决的问题.关键词自动抽取技术是实现信息的智能检索和标引分类的核心技术,本文提出了一种改进TextRank的关键词抽取算法应用于铁路文献关键词的抽取,该算法融合多个特征因素改进词汇节点的初始权重设置,并利用Word2Vec训练的词向量表征改进词节点间的转移概率.实验结果表明:本文所提出的关键词抽取算法相对于经典的TextRank和TF-IDF算法在准确率,召回率以及F值上都有较大的提升.与TextRank相比,F值提升了13.9%. 展开更多
关键词 抽取 Word2Vec模型 textrank算法
在线阅读 下载PDF
基于改进TextRank的关键句提取方法 被引量:3
8
作者 陈梦彤 谷晓燕 刘甜甜 《郑州大学学报(理学版)》 CAS 北大核心 2023年第1期15-20,共6页
在进行文本挖掘时,通常根据关键词分析文本,这种方式容易忽略词语之间的关联性,影响文本挖掘的准确性。TextRank算法是提取关键词或者摘要的主要方法,该算法基于网络图考虑了句子间相似性,但是忽略了词语的特征。基于此,提出了一种改进T... 在进行文本挖掘时,通常根据关键词分析文本,这种方式容易忽略词语之间的关联性,影响文本挖掘的准确性。TextRank算法是提取关键词或者摘要的主要方法,该算法基于网络图考虑了句子间相似性,但是忽略了词语的特征。基于此,提出了一种改进TextRank算法,将相似语句合并后,考虑多种词特征进行关键句选取。首先,计算语句相似度,并且去除文中相似性较高的语句;然后,根据词频、词义、词位置对词语打分,构建有向图;最后,计算语句平均得分进行排序,选出关键句。实验结果表明,改进后的算法准确性优于其他算法,算法的时间复杂度降低,并且解决了关键词对文本描述片面和摘要烦琐的问题。 展开更多
关键词 关键句提取 改进textrank算法 相似句合并 词特征
在线阅读 下载PDF
基于改进TextRank的文本摘要自动提取 被引量:15
9
作者 汪旭祥 韩斌 +1 位作者 高瑞 陈鹏 《计算机应用与软件》 北大核心 2021年第6期155-160,共6页
TextRank算法在自动提取中文文本摘要时只考虑句子间的相似性,而忽略了词语间的语义相关信息及文本的重要全局信息。对此,提出一种基于改进TextRank的文本摘要自动提取算法(SW-TextRank)。通过Word2Vec训练的词向量来计算句子之间的相似... TextRank算法在自动提取中文文本摘要时只考虑句子间的相似性,而忽略了词语间的语义相关信息及文本的重要全局信息。对此,提出一种基于改进TextRank的文本摘要自动提取算法(SW-TextRank)。通过Word2Vec训练的词向量来计算句子之间的相似度,并综合考虑句子位置、句子与标题的相似度、关键词的覆盖率、关键句子以及线索词等影响句子权重的因素,从而优化句子权重;对得到的候选摘要句群进行冗余处理,选取适量排序靠前的句子并根据其在原文中的顺序重新排列得到最终文本的摘要。实验结果表明,SW-TextRank算法生成摘要的准确性比TextRank算法更高,摘要生成质量更好。 展开更多
关键词 文本摘要 SW-textrank算法 词向量 相似度 句子权重
在线阅读 下载PDF
基于TextRank算法和互信息相似度的维吾尔文关键词提取及文本分类 被引量:9
10
作者 阿力甫.阿不都克里木 李晓 《计算机科学》 CSCD 北大核心 2016年第12期36-40,共5页
针对维吾尔语文本的分类问题,提出一种基于TextRank算法和互信息相似度的维吾尔文关键词提取及文本分类方法。首先,对输入文本进行预处理,滤除非维吾尔语的字符和停用词;然后,利用词语语义相似度、词语位置和词频重要性加权的TextRank... 针对维吾尔语文本的分类问题,提出一种基于TextRank算法和互信息相似度的维吾尔文关键词提取及文本分类方法。首先,对输入文本进行预处理,滤除非维吾尔语的字符和停用词;然后,利用词语语义相似度、词语位置和词频重要性加权的TextRank算法提取文本关键词集合;最后,根据互信息相似度度量,计算输入文本关键词集和各类关键词集的相似度,最终实现文本的分类。实验结果表明,该方案能够提取出具有较高识别度的关键词,当关键词集大小为1250时,平均分类率达到了91.2%。 展开更多
关键词 维吾尔语 文本分类 关键词提取 textrank算法 互信息相似度
在线阅读 下载PDF
一种基于TextRank的单文本关键字提取算法 被引量:20
11
作者 柳林青 余瀚 +1 位作者 费宁 陈春玲 《计算机应用研究》 CSCD 北大核心 2018年第3期705-710,共6页
作为一种经典的文本关键字提取和摘要自动生成算法,TextRank将文本看做若干单词组成的集合,并通过对单词节点图的节点权值进行迭代计算,挖掘单词之间的潜在语义关系。在TextRank节点图模型的基础上,将马尔可夫状态转移模型与节点图相结... 作为一种经典的文本关键字提取和摘要自动生成算法,TextRank将文本看做若干单词组成的集合,并通过对单词节点图的节点权值进行迭代计算,挖掘单词之间的潜在语义关系。在TextRank节点图模型的基础上,将马尔可夫状态转移模型与节点图相结合,提出节点间边权为条件概率的新模型生成算法TextRank_Revised。通过对有标记和无标记的验证集进行验证,证明新的算法在不提升时间复杂度的前提下,通过计算单文本得出的单词排序结果相较于原TextRank算法更加吻合人工对文档的关键字提取结果。 展开更多
关键词 textrank 单文本关键字 提取算法 有向带权图 马尔可夫状态转移模型
在线阅读 下载PDF
基于粗糙数据推理的TextRank关键词提取算法 被引量:16
12
作者 周宁 石雯茜 朱昭昭 《中文信息学报》 CSCD 北大核心 2020年第9期44-52,共9页
基于图模型的TextRank算法是一种有效的关键词提取算法,在提取关键词时可取得较高准确度。但该算法在构造图的关联边时,所采用的共现窗口规则仅考虑了局部词汇间的关联,并具有较大随意性与不确定性。针对这一问题,该文提出了一种基于粗... 基于图模型的TextRank算法是一种有效的关键词提取算法,在提取关键词时可取得较高准确度。但该算法在构造图的关联边时,所采用的共现窗口规则仅考虑了局部词汇间的关联,并具有较大随意性与不确定性。针对这一问题,该文提出了一种基于粗糙数据推理理论的改进TextRank关键词提取算法,粗糙数据推理可扩大关联范围,增加关联数据,得到的结果更加全面。结合粗糙数据推理理论中的关联规则,该文提出的算法做了以下改进:依据词义对候选关键词进行划分;再通过粗糙数据推理对不同分类中候选词间的关联关系进行推理。实验结果表明,与传统的TextRank算法相比,改进后算法的提取精度有了明显的提高,证明了利用粗糙数据推理的思想能有效地改善算法提取关键词的性能。 展开更多
关键词 粗糙数据推理 关键词提取 关联规则 textrank算法
在线阅读 下载PDF
结合拓扑势与TextRank算法的关键词提取方法 被引量:14
13
作者 罗婉丽 张磊 《计算机应用与软件》 北大核心 2022年第1期334-338,共5页
传统的TextRank算法进行关键词提取时词语之间的连接边采用权值均分的形式进行加权,未考虑词语的语义信息。针对这种情况,提出结合拓扑势与TextRank算法的关键词提取方法。方法使用词频和词语在文中的分布情况对词语加权作为词语的全局... 传统的TextRank算法进行关键词提取时词语之间的连接边采用权值均分的形式进行加权,未考虑词语的语义信息。针对这种情况,提出结合拓扑势与TextRank算法的关键词提取方法。方法使用词频和词语在文中的分布情况对词语加权作为词语的全局影响;使用拓扑势的思想结合词语全局影响计算词语间的转移概率作为词语的局部影响;将转移概率矩阵应用于传统TextRank算法中。实验表明,考虑词语全局及局部重要性等语义信息可有效提升TextRank算法的准确率和召回率。 展开更多
关键词 textrank算法 关键词提取 语义信息 拓扑势
在线阅读 下载PDF
基于TextRank的文本情感摘要提取方法 被引量:10
14
作者 荀静 杨玉珍 《计算机应用与软件》 北大核心 2018年第10期80-84,共5页
为了能够快速准确把握评论文本的核心情感内容,提出一种融合多特征的TextRank中文文本情感摘要方法。通过构建TextRank文本网络图,迭代计算得到句子权重;应用句子的情感特征和自身特征修正句子权重,生成粗文摘;提取情感摘要。实验结果表... 为了能够快速准确把握评论文本的核心情感内容,提出一种融合多特征的TextRank中文文本情感摘要方法。通过构建TextRank文本网络图,迭代计算得到句子权重;应用句子的情感特征和自身特征修正句子权重,生成粗文摘;提取情感摘要。实验结果表明,该方法能够有效地识别文本中的情感主题句,在ROUGE-1、ROUGE-2和ROUGE-W指标上均有不错的效果。 展开更多
关键词 特征融合 textrank算法 图模型 情感摘要
在线阅读 下载PDF
融合新词发现和改进TextRank算法的农业领域关键词提取算法 被引量:1
15
作者 邸小康 张辉 +3 位作者 秦晓婧 齐世杰 王彩虹 程旭 《农业工程》 2023年第6期21-25,共5页
针对农业领域文本中专业术语类关键词提取困难的问题,提出了一种融合新词发现和改进TextRank算法的农业领域关键词提取方法。该算法利用信息熵对文本中的词进行成词概率计算,以此发现领域专有名词和新词,通过人工审核扩充分词字典;在分... 针对农业领域文本中专业术语类关键词提取困难的问题,提出了一种融合新词发现和改进TextRank算法的农业领域关键词提取方法。该算法利用信息熵对文本中的词进行成词概率计算,以此发现领域专有名词和新词,通过人工审核扩充分词字典;在分词字典基础上,改进TextRank算法在词图构建中节点值的计算方法,添加词语位置和词性权重,利用词语综合权重提取文本关键词。对比结果表明,该算法的F值比传统的TF-IDF算法平均提高7.5%,比TextRank算法平均提高9.8%,具有一定的实用性。 展开更多
关键词 提取 新词发现 信息熵 textrank算法
在线阅读 下载PDF
基于层次聚类和TextRank的视频摘要 被引量:2
16
作者 张璐 吕进来 《计算机工程与设计》 北大核心 2019年第7期1945-1949,共5页
为解决基于聚类算法的视频摘要中存在的需要预先设定聚类中心和聚类数目及选取的关键帧不具有代表性的问题,提出一种基于层次聚类与TextRank算法的静态视频摘要方法。使用层次聚类算法对视频帧进行聚类,利用TextRank算法选取候选关键帧... 为解决基于聚类算法的视频摘要中存在的需要预先设定聚类中心和聚类数目及选取的关键帧不具有代表性的问题,提出一种基于层次聚类与TextRank算法的静态视频摘要方法。使用层次聚类算法对视频帧进行聚类,利用TextRank算法选取候选关键帧集合,通过求解优化函数选择最终的关键帧生成视频摘要。实验结果表明,该方法生成的视频摘要能够比较全面准确地表达视频内容且冗余度低。 展开更多
关键词 视频摘要 视频帧分类 关键帧提取 层次聚类 textrank算法
在线阅读 下载PDF
一种基于共现关键词的TextRank文摘自动生成算法 被引量:8
17
作者 阎红灿 李铂初 谷建涛 《计算机工程与科学》 CSCD 北大核心 2023年第11期2060-2069,共10页
传统TextRank算法在生成摘要时只考虑句子间的相似度,忽略了文章本身间的相似度,且生成的摘要往往包含重复的信息表达。为此,提出一种基于共现关键词的TextRank算法,用word2vec模型将文章表示为句向量,考虑到文章的类别,将该类文章的共... 传统TextRank算法在生成摘要时只考虑句子间的相似度,忽略了文章本身间的相似度,且生成的摘要往往包含重复的信息表达。为此,提出一种基于共现关键词的TextRank算法,用word2vec模型将文章表示为句向量,考虑到文章的类别,将该类文章的共现关键词作为参数参与句子权值的迭代计算,然后,通过句子长度、关键词数量等信息对迭代得到的句子权重加以修正。实验结果表明,所提算法能够提高生成摘要的全面性和准确性。同时,所提算法使用MMR对抽取得到的摘要进行去除冗余处理,改善了摘要的重复表达情况。 展开更多
关键词 自动摘要生成 textrank 共现关键词 MMR算法 word2vec模型
在线阅读 下载PDF
基于AI算法的自然语言信息提取-翻译-校对系统设计 被引量:5
18
作者 崔丹 李舒淇 《现代电子技术》 北大核心 2024年第10期111-116,共6页
自20世纪90年代起,随着人工智能(AI)的飞速发展及其与深度学习等机器学习方法的广泛融合,自然语言处理(NLP)作为人工智能的核心,也取得了令人瞩目的进步。而随着国际学术交流、世界文化交融愈加频繁,人们搜寻、阅读他国网络信息的现实... 自20世纪90年代起,随着人工智能(AI)的飞速发展及其与深度学习等机器学习方法的广泛融合,自然语言处理(NLP)作为人工智能的核心,也取得了令人瞩目的进步。而随着国际学术交流、世界文化交融愈加频繁,人们搜寻、阅读他国网络信息的现实需求也随之增多。当信息搜寻者在搜寻非母语信息时,不仅会出现语言障碍问题,还会因错综复杂、层次不齐的各色信息而产生诸多不便。为了便于信息搜寻者快速高效地获取有用信息,文中基于人工智能算法(PageRank/TextRank)设计一种信息提取-翻译-校对(ETP)系统。系统通过AI自动搜索阅读页面上的重要信息和文本摘取,生成摘要,并基于机器翻译API模块完成翻译;其次,采用智能校对系统完成校对审核后,将信息呈现给搜寻者,以供其对全部信息高效且准确地进行预筛选,从而节省阅读时间和精力。最后对系统算法所实现的功能进行实验测试,结果达到预期。 展开更多
关键词 AI算法 自然语言处理 信息提取 机器翻译 翻译校对 PAGERANK算法 textrank算法
在线阅读 下载PDF
面向风电机组运维的知识图谱构建研究与应用 被引量:11
19
作者 黄简 杨程 +4 位作者 冯天波 孙宁 李嘉文 余恒文 崔昊杨 《电力系统保护与控制》 EI CSCD 北大核心 2024年第8期167-177,共11页
规模化风机高频运维信息愈发呈现数据高维、类间互联、规模攀升的特点,传统人工孤岛式故障检修运维模式难以适应人机料法环一体式发展进程。针对风机全环节、全要素的主动运维要求,提出知识规则、主从设备、规范条例一体融合的风电机组... 规模化风机高频运维信息愈发呈现数据高维、类间互联、规模攀升的特点,传统人工孤岛式故障检修运维模式难以适应人机料法环一体式发展进程。针对风机全环节、全要素的主动运维要求,提出知识规则、主从设备、规范条例一体融合的风电机组运维知识图谱构建方法。利用图论文本关键词提取算法(TextRank)完成对风电专业运维文本的实体识别与关系抽取,用以提高特征词的提取精度。采用Neo4j图数据库构建风电安全管理规程图谱及风电设备运维图谱,实现多元数据的互联与可视,进而实现风电运维信息的智能化查询。应用上述方法构建了629个实体、742条关系类型的风机知识图谱。数据查询试验表明:该方法的精确率及召回率等主要指标均在89%以上,较传统数据库方法平均提升了6.5%。该方法建立了运维要求可视表达和类间任务关联。运维大数据的有效查询,将有助于节省双碳战略风电运维力量,提高运维智能化水平。 展开更多
关键词 风电机组运维 知识图谱 textrank算法 Neo4j图数据库
在线阅读 下载PDF
基于指针网络的抽取生成式摘要生成模型 被引量:3
20
作者 陈伟 杨燕 《计算机应用》 CSCD 北大核心 2021年第12期3527-3533,共7页
作为自然语言处理中的热点问题,摘要生成具有重要的研究意义。基于Seq2Seq模型的生成式摘要模型取得了良好的效果,然而抽取式的方法具有挖掘有效特征并抽取文章重要句子的潜力,因此如何利用抽取式方法来改进生成式方法是一个较好的研究... 作为自然语言处理中的热点问题,摘要生成具有重要的研究意义。基于Seq2Seq模型的生成式摘要模型取得了良好的效果,然而抽取式的方法具有挖掘有效特征并抽取文章重要句子的潜力,因此如何利用抽取式方法来改进生成式方法是一个较好的研究方向。鉴于此,提出了融合生成式和抽取式方法的模型。首先,使用TextRank算法并融合主题相似度来抽取文章中有重要意义的句子。然后,设计了融合抽取信息语义的基于Seq2Seq模型的生成式框架来实现摘要生成任务;同时,引入指针网络解决模型训练中的未登录词(OOV)问题。综合以上步骤得到最终摘要,并在CNN/Daily Mail数据集上进行验证。结果表明在ROUGE-1、ROUGE-2和ROUGE-L三个指标上所提模型比传统TextRank算法均有所提升,同时也验证了融合抽取式和生成式方法在摘要生成领域中的有效性。 展开更多
关键词 抽取生成式摘要 textrank算法 Seq2Seq模型 指针网络 语义融合
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部