期刊文献+
共找到44篇文章
< 1 2 3 >
每页显示 20 50 100
基于TextRank和自注意力的长文档无监督抽取式摘要
1
作者 邢玲 程兵 闫强 《计算机应用与软件》 北大核心 2025年第3期274-283,共10页
针对中文长文档自动文本摘要问题,提出将TextRank与自注意力相融合的两种模型:TRAI和TRAO。TRAI将基于统计共现字数得到的句子相似性同基于自注意力得到的句子相关性进行加权求和,作为TextRank边的权重参与迭代计算,对句子进行打分。TRA... 针对中文长文档自动文本摘要问题,提出将TextRank与自注意力相融合的两种模型:TRAI和TRAO。TRAI将基于统计共现字数得到的句子相似性同基于自注意力得到的句子相关性进行加权求和,作为TextRank边的权重参与迭代计算,对句子进行打分。TRAO利用TextRank对句子打分;利用自注意力重新表示每个句子融合整个文档信息的分布式向量,在此基础上计算句子间余弦相似度,作为TextRank边的权重参与迭代计算,给句子打分;将两种得分加权求和作为句子最终得分。两种模型均根据得分对句子进行排序得到候选摘要。为去除摘要冗余性,利用最大边界相关法(Maximal Marginal Relevance,MMR)在候选摘要中选取摘要句子。将提出的两种模型在构建的长文档上进行实验,与TextRank方法相比,所提方法在ROUGE评价指标上有显著提高。 展开更多
关键词 中文长文本摘要 TextRank 自注意力机制 分布式向量表示 语义信息 融合文档信息
在线阅读 下载PDF
低资源场景下的汉语—传统蒙古语跨语言摘要方法研究
2
作者 班琪 云静 邓磊 《计算机工程与科学》 北大核心 2025年第5期931-939,共9页
跨语言摘要任务旨在给定一种语言的源文档(如中文)生成目标语言(如传统蒙古文)的摘要。传统的多任务框架通常采用序列到序列的网络,应用多个专用于各特定任务的解码器。然而,在将文档从一种语言提炼为另一种具有不同形态和结构特性语言... 跨语言摘要任务旨在给定一种语言的源文档(如中文)生成目标语言(如传统蒙古文)的摘要。传统的多任务框架通常采用序列到序列的网络,应用多个专用于各特定任务的解码器。然而,在将文档从一种语言提炼为另一种具有不同形态和结构特性语言的摘要时,多任务框架无法有效捕捉和理解2种语言之间的关系和差异。特别是对于传统蒙古语,其形态变化繁杂、构词形式多样的特点,使得低资源下语言特征的学习和处理变得更加困难。为了解决这一问题,提出一种在多任务框架中引入一致性学习的跨语言摘要模型。通过计算源语言摘要和生成的目标语言摘要之间概率分布差异的距离度量进行一致性建模,在交叉熵损失和一致性损失的约束下优化跨语言摘要模型。此外,构建了一个中—蒙跨语言摘要数据集,在此数据集上获得了有竞争力的ROUGE分数,表明了所提模型在资源匮乏情况下的有效性。 展开更多
关键词 中—蒙跨语言摘要 一致性学习 低资源
在线阅读 下载PDF
基于知识的文本摘要系统研究与实现 被引量:19
3
作者 孙春葵 李蕾 +1 位作者 杨晓兰 钟义信 《计算机研究与发展》 EI CSCD 北大核心 2000年第7期874-881,共8页
提出了一个基于知识的文摘系统模型 ,并基于这种模型实现了一个文本摘要系统 L ADIES.另外 ,还提出了一种文摘系统的评估方法 .
关键词 中文信息处理 知识 文本摘要系统
在线阅读 下载PDF
自动文摘评价方法综述 被引量:12
4
作者 张瑾 王小磊 许洪波 《中文信息学报》 CSCD 北大核心 2008年第3期81-88,共8页
评价是自动文摘领域长期关注的焦点,对自动文摘技术的发展起着积极的促进作用。本文首先介绍了自动文摘评价方法的应用背景和面临的困难;然后对自动文摘评价方法进行了简单介绍和评价;接着在了解国内外研究现状的基础上详细分析了文摘... 评价是自动文摘领域长期关注的焦点,对自动文摘技术的发展起着积极的促进作用。本文首先介绍了自动文摘评价方法的应用背景和面临的困难;然后对自动文摘评价方法进行了简单介绍和评价;接着在了解国内外研究现状的基础上详细分析了文摘评价方法的关键技术;最后对自动文摘评价方法未来的发展趋势进行了展望。 展开更多
关键词 计算机应用 中文信息处理 文本挖掘 自动文摘 自然语言处理 多文档文摘 文摘评价方法
在线阅读 下载PDF
基于事件抽取的网络新闻多文档自动摘要 被引量:15
5
作者 韩永峰 许旭阳 +2 位作者 李弼程 朱武斌 陈刚 《中文信息学报》 CSCD 北大核心 2012年第1期58-66,共9页
目前,有代表性的自动摘要方法是根据文本片段进行聚类,较传统方法避免了信息冗余,但网络新闻文本中有些文本片段和主题无关,影响了聚类的效果,导致最终生成的摘要不够简洁。为此,该文引入事件抽取技术,提出了一种基于事件抽取的网络新... 目前,有代表性的自动摘要方法是根据文本片段进行聚类,较传统方法避免了信息冗余,但网络新闻文本中有些文本片段和主题无关,影响了聚类的效果,导致最终生成的摘要不够简洁。为此,该文引入事件抽取技术,提出了一种基于事件抽取的网络新闻多文档自动摘要方法。该方法首先通过二元分类器辨析出文本中的事件和非事件;然后通过聚类将文档原来以段落或句子为单位的物理划分转化为以事件为单位的内容逻辑划分,最后通过主旨事件抽取、排序及润色,生成摘要。实验结果表明,该方法是有效的,显著提高了生成摘要的质量。 展开更多
关键词 事件抽取 中文信息处理 分类 新闻文档 聚类 自动摘要
在线阅读 下载PDF
基于改进的TextRank的自动摘要提取方法 被引量:42
6
作者 余珊珊 苏锦钿 李鹏飞 《计算机科学》 CSCD 北大核心 2016年第6期240-247,共8页
经典的TextRank算法在文档的自动摘要提取时往往只考虑了句子节点间的相似性,而忽略了文档的篇章结构及句子的上下文信息。针对这些问题,结合中文文本的结构特点,提出一种改进后的iTextRank算法,通过将标题、段落、特殊句子、句子位置... 经典的TextRank算法在文档的自动摘要提取时往往只考虑了句子节点间的相似性,而忽略了文档的篇章结构及句子的上下文信息。针对这些问题,结合中文文本的结构特点,提出一种改进后的iTextRank算法,通过将标题、段落、特殊句子、句子位置和长度等信息引入到TextRank网络图的构造中,给出改进后的句子相似度计算方法及权重调整因子,并将其应用于中文文本的自动摘要提取,同时分析了算法的时间复杂度。最后,实验证明iTextRank比经典的TextRank方法具有更高的准确率和更低的召回率。 展开更多
关键词 中文文本 自动摘要提取 TextRank 篇章结构 无监督学习方法
在线阅读 下载PDF
面向冗余度控制的中文多文档自动文摘 被引量:6
7
作者 王红玲 周国栋 朱巧明 《中文信息学报》 CSCD 北大核心 2012年第2期92-96,共5页
多文档自动文摘能够帮助人们自动、快速地获取信息,是目前的一个研究热点。相比于单文档自动文摘,多文档自动文摘需要更多考虑文档之间的相关性,以及文档信息之间的冗余性。因此如何控制信息冗余是多文档自动文摘的一个关键所在。该文... 多文档自动文摘能够帮助人们自动、快速地获取信息,是目前的一个研究热点。相比于单文档自动文摘,多文档自动文摘需要更多考虑文档之间的相关性,以及文档信息之间的冗余性。因此如何控制信息冗余是多文档自动文摘的一个关键所在。该文在考虑文摘特性的基础上提出了一个冗余度控制模型,该模型通过计算文本单元在主题概率分布之间的相似度来决定句子的选择,从而达到控制冗余的目的。实验结果表明,该方法能够有效降低冗余度,且总体性能优于现有的自动文摘系统。 展开更多
关键词 冗余度控制 多文档自动文摘 中文自动文摘
在线阅读 下载PDF
一种新的句子相似度度量及其在文本自动摘要中的应用 被引量:34
8
作者 张奇 黄萱菁 吴立德 《中文信息学报》 CSCD 北大核心 2005年第2期93-99,共7页
本文提出了一种新的句子相似度度量的方法并应用于文本自动摘要中。其创新处在于相似度计算不仅考虑句子中的uni gram ,还考虑了bi gram和tri gram ,通过回归方法将这几种相似度结果综合起来。实验证明这种相似度计算方法是有效的。同... 本文提出了一种新的句子相似度度量的方法并应用于文本自动摘要中。其创新处在于相似度计算不仅考虑句子中的uni gram ,还考虑了bi gram和tri gram ,通过回归方法将这几种相似度结果综合起来。实验证明这种相似度计算方法是有效的。同时本文还提出了一种新的 ,利用句子间相似度以及句子的权重的抽句式文摘算法 ,在抽取出句子的同时也去掉了冗余。DUC2 0 0 3、DUC2 0 0 4 (DocumentUnderstandingConference 2 0 0 3,2 0 0 4 )的评测结果征明了方法的有效性。我们的系统在DUC2 0 0 4的评测中列第二位。 展开更多
关键词 计算机应用 中文信息处理 文本自动摘要 向量模型 相似度计算
在线阅读 下载PDF
基于HowNet概念获取的中文自动文摘系统 被引量:22
9
作者 王萌 何婷婷 +1 位作者 姬东鸿 王晓荣 《中文信息学报》 CSCD 北大核心 2005年第3期87-93,共7页
本文提出了一种中文自动文摘的方法。不同于其它的基于词频统计的一般方法,运用概念(词义)作为特征取代词语。用概念统计代替传统的词形频率统计方法,建立概念向量空间模型,计算出句子重要度,并对句子进行冗余度计算,抽取文摘句。对于... 本文提出了一种中文自动文摘的方法。不同于其它的基于词频统计的一般方法,运用概念(词义)作为特征取代词语。用概念统计代替传统的词形频率统计方法,建立概念向量空间模型,计算出句子重要度,并对句子进行冗余度计算,抽取文摘句。对于文摘测试,采用两种不同的方法进行测试:一是用机器文摘和专家文摘进行比较的内部测试;二是对不同文摘方法进行分类,通过对分类正确率的比较的外部评测方法。 展开更多
关键词 计算机应用 中文信息处理 HOWNET 自动文摘 概念向量空间模型
在线阅读 下载PDF
多文档文摘中基于时间信息的句子排序策略研究 被引量:8
10
作者 徐永东 王亚东 +2 位作者 刘杨 王伟 权光日 《中文信息学报》 CSCD 北大核心 2009年第4期27-33,共7页
文摘句排序是多文档自动文摘中的一个关键技术,直接影响到文摘的流畅程度和可读性。文本时间信息处理是影响排序算法质量的瓶颈技术,由于无法获得准确的时间信息,传统的句子排序策略均回避了这一问题,而且均无法获得稳定的高质量的排序... 文摘句排序是多文档自动文摘中的一个关键技术,直接影响到文摘的流畅程度和可读性。文本时间信息处理是影响排序算法质量的瓶颈技术,由于无法获得准确的时间信息,传统的句子排序策略均回避了这一问题,而且均无法获得稳定的高质量的排序效果。对此该文从文本时间信息处理入手,首先提出了中文文本时间信息抽取、语义计算以及时序推理算法,并在此算法基础上,借鉴传统的主成分排列的思想和句子相关度计算方法,提出了基于时间信息的句子排序算法。实验表明该算法的质量要明显好于传统的主成分排列算法和时序排列算法。 展开更多
关键词 计算机应用 中文信息处理 多文档自动文摘 句子排序 中文时间信息处理
在线阅读 下载PDF
面向中文新闻领域的移动摘要系统 被引量:4
11
作者 宋锐 林鸿飞 杨志豪 《中文信息学报》 CSCD 北大核心 2008年第1期87-92,共6页
面向移动终端的自动摘要技术,对摘要本身提出了更严格的字数要求。本文设计了一个面向中文新闻领域的移动摘要系统,提取网页中的最大重复串作为文档的关键词集合,利用编辑距离生成适于在移动终端上显示的摘要。对于含有子标题的文档,采... 面向移动终端的自动摘要技术,对摘要本身提出了更严格的字数要求。本文设计了一个面向中文新闻领域的移动摘要系统,提取网页中的最大重复串作为文档的关键词集合,利用编辑距离生成适于在移动终端上显示的摘要。对于含有子标题的文档,采用层次型的摘要结构,以提高摘要的覆盖率,并用基于Q&A的评测方法验证了层次型摘要结构对该类文档的有效性。实验结果表明,生成的移动摘要在字数、可读性和完整性具有很好的效果。 展开更多
关键词 计算机应用 中文信息处理 移动摘要 最大重复串 编辑距离 层次型摘要
在线阅读 下载PDF
神经病理性疼痛及其中医药治疗的研究进展 被引量:9
12
作者 许俊杰 陈眉 《中华中医药学刊》 CAS 2010年第10期2110-2113,共4页
疼痛(pain)是当今困扰人类健康的最严重的问题之一,所以疼痛的机制及治疗的研究已成为当今神经科学研究的热点问题,临床慢性疼痛为一种常见的疼痛类型,是一个复杂的神经病理与主观感受症状,产生原因多种多样。随着人们对疼痛病理认识的... 疼痛(pain)是当今困扰人类健康的最严重的问题之一,所以疼痛的机制及治疗的研究已成为当今神经科学研究的热点问题,临床慢性疼痛为一种常见的疼痛类型,是一个复杂的神经病理与主观感受症状,产生原因多种多样。随着人们对疼痛病理认识的深入,中医药止痛研究取得了新的进展。中医药现代化的研究也为中药止痛药开辟了一块新的天地。本文对神经病理性疼痛的机制以及中医药镇痛治疗的研究做一综述。预计中药止痛药在疼痛治疗方面将有更为广阔的前景。 展开更多
关键词 神经病理性疼痛 中医药 镇痛 综述文献
在线阅读 下载PDF
一种基于演化算法进行句子抽取的多文档自动摘要系统SBGA 被引量:10
13
作者 刘德喜 何炎祥 +1 位作者 姬东鸿 杨华 《中文信息学报》 CSCD 北大核心 2006年第6期46-53,共8页
SBGA系统将多文档自动摘要过程视为一个从源文档集中抽取句子的组合优化过程,并用演化算法来求得近似最优解。与基于聚类的句子抽取方法相比,基于演化算法进行句子抽取的方法是面向摘要整体的,因此能获得更好的近似最优摘要。演化算法... SBGA系统将多文档自动摘要过程视为一个从源文档集中抽取句子的组合优化过程,并用演化算法来求得近似最优解。与基于聚类的句子抽取方法相比,基于演化算法进行句子抽取的方法是面向摘要整体的,因此能获得更好的近似最优摘要。演化算法的评价函数中考虑了衡量摘要的4个标准:长度符合用户要求、信息覆盖率高、更多地保留原文传递的重要信息、无冗余。另外,为了提高词频计算的精度,SBGA采用了一种改进的词频计算方法TFS,将加权后词的同义词频率加到了原词频中。在DUC2004测试数据集上的实验结果表明,基于演化算法进行句子抽取的方法有很好的性能,其ROUGE-1分值比DUC2004最优参赛系统仅低0.55%。改进的词频计算方法TFS对提高文档质量也起到了良好的作用。 展开更多
关键词 计算机应用 中文信息处理 多文档自动摘要 演化算法 句子抽取 评价函数 TFS
在线阅读 下载PDF
近10年国内抗肿瘤中药作用机理的研究进展 被引量:2
14
作者 马保玉 耿耘 +1 位作者 李永超 余德林 《中华中医药学刊》 CAS 2012年第11期2435-2436,共2页
肿瘤是一种严重威胁人类健康的常见病,近年来中药及其有效成分在研究抗肿瘤工作方面取得了明显的效果,其主要作用机理包括:增强免疫作用、抑制肿瘤细胞增殖、抑制肿瘤血管生长、诱导细胞凋亡、诱导细胞分化、逆转多药耐药机理及抗微管... 肿瘤是一种严重威胁人类健康的常见病,近年来中药及其有效成分在研究抗肿瘤工作方面取得了明显的效果,其主要作用机理包括:增强免疫作用、抑制肿瘤细胞增殖、抑制肿瘤血管生长、诱导细胞凋亡、诱导细胞分化、逆转多药耐药机理及抗微管等作用。 展开更多
关键词 中药 抗肿瘤 综述
在线阅读 下载PDF
基于规则和统计的中文自动文摘系统 被引量:21
15
作者 傅间莲 陈群秀 《中文信息学报》 CSCD 北大核心 2006年第5期10-16,共7页
自动文摘是自然语言处理领域里一个重要课题,本文在传统方法基础上提出了一种中文自动文摘的方法。在篇章结构分析里,我们提出了基于连续段落相似度的主题划分算法,使生成的文摘更具内容全面性与结构平衡性。同时结合了若干规则对生成... 自动文摘是自然语言处理领域里一个重要课题,本文在传统方法基础上提出了一种中文自动文摘的方法。在篇章结构分析里,我们提出了基于连续段落相似度的主题划分算法,使生成的文摘更具内容全面性与结构平衡性。同时结合了若干规则对生成的文摘初稿进行可读性加工处理,使最终生成的文摘更具可读性。最后提出了一种新的文摘评价方法(F-new-m easure)对系统进行测试。系统测试表明该方法在不同文摘压缩率时,评价值均较为稳定。 展开更多
关键词 计算机应用 中文信息处理 自动文摘 向量空间模型 主题划分 可读性 评价
在线阅读 下载PDF
卵巢不敏感综合征的中西医研究进展 被引量:2
16
作者 黄文玲 楼姣英 +1 位作者 金哲 李玲 《辽宁中医杂志》 CAS 北大核心 2009年第9期1624-1626,共3页
卵巢不敏感综合征(ROS)是以卵巢内有多量始基卵泡,少见窦状卵泡,无成熟卵泡为病理特征的综合征,临床主要表现为原发或继发闭经、内源性促性腺激素水平升高,染色体组型正常,卵巢对外源性促性腺激素刺激呈低反应。通过回顾近年现代医学对... 卵巢不敏感综合征(ROS)是以卵巢内有多量始基卵泡,少见窦状卵泡,无成熟卵泡为病理特征的综合征,临床主要表现为原发或继发闭经、内源性促性腺激素水平升高,染色体组型正常,卵巢对外源性促性腺激素刺激呈低反应。通过回顾近年现代医学对卵巢不敏感综合征的文献研究,对本病发病机制、病理、临床表现及诊断、中西医治疗方法予以综述。 展开更多
关键词 卵巢不敏感综合征 中西医 综述
在线阅读 下载PDF
基于Web的文摘技术研究 被引量:1
17
作者 耿增民 贾云得 +1 位作者 刘万春 朱玉文 《中文信息学报》 CSCD 北大核心 2006年第6期54-60,108,共8页
W eb文档的迅猛增长使W eb文摘技术成了当今的一个研究热点。由于W eb文档的特殊性,使得W eb文摘不同于传统的文本自动文摘。本文分析了W eb文档的特点;给出了W eb文摘的定义;提出了基于句子抽取的W eb文摘生成算法。算法中将每个W eb... W eb文档的迅猛增长使W eb文摘技术成了当今的一个研究热点。由于W eb文档的特殊性,使得W eb文摘不同于传统的文本自动文摘。本文分析了W eb文档的特点;给出了W eb文摘的定义;提出了基于句子抽取的W eb文摘生成算法。算法中将每个W eb句子权重分解为W eb特征词权重和W eb句子结构权重,并用机器学习的方法来计算二者所占的比重。W eb特征词权重根据文档分类树图进行权值调整,W eb句子结构权重充分考虑排版格式和超连接属性。通过对1000篇W eb文档的文摘实验,证明文中所提W eb文摘算法切实可行。 展开更多
关键词 计算机应用 中文信息处理 Web文摘 文本文摘 Web文档预处理 文摘后处理
在线阅读 下载PDF
基于文档语义图的中文多文档摘要生成机制 被引量:6
18
作者 宋锐 林鸿飞 《中文信息学报》 CSCD 北大核心 2009年第3期110-115,共6页
从文档集合的语义结构理解文档集合可以提高多文档摘要的质量。本文通过抽取中文多文档摘要文档集中的主-述-宾三元组结构构建文档语义图,再对语义图中的节点利用编辑距离进行语义聚类,并应用Page-Rank排序算法对语义图进行权重计算后,... 从文档集合的语义结构理解文档集合可以提高多文档摘要的质量。本文通过抽取中文多文档摘要文档集中的主-述-宾三元组结构构建文档语义图,再对语义图中的节点利用编辑距离进行语义聚类,并应用Page-Rank排序算法对语义图进行权重计算后,选取包含权重较高的节点及链接关系的三元组生成文档集合的多文档摘要。在摘要的评测阶段,将基于句子抽取的多文档摘要结果和基于文档语义图生成的多文档摘要分别与由评测员人工生成的摘要进行ROUGE相关度评测,并对利用编辑距离对语义图进行语义聚类前后的结果进行了比较。实验结果表明,基于文档语义图生成的多文档摘要与人工生成的摘要结果重叠度更高,而利用编辑距离对语义图进行聚类则进一步改进了摘要的质量。 展开更多
关键词 计算机应用 中文信息处理 文档语义图 编辑距离 PAGERANK ROUGE 中文多文档摘要
在线阅读 下载PDF
基于段落匹配和分布密度的偏重摘要实现机制 被引量:1
19
作者 林鸿飞 杨志豪 赵晶 《中文信息学报》 CSCD 北大核心 2007年第1期43-48,共6页
本文提出了基于段落匹配和分布密度的偏重文本摘要实现机制,旨在满足摘要的个性化要求。首先在关键字同义扩充的基础上,利用基于侧面相似度的段落匹配方法,获取相关的文本段落集合。然后通过计算文本窗口的分布密度函数,获取关键字集聚... 本文提出了基于段落匹配和分布密度的偏重文本摘要实现机制,旨在满足摘要的个性化要求。首先在关键字同义扩充的基础上,利用基于侧面相似度的段落匹配方法,获取相关的文本段落集合。然后通过计算文本窗口的分布密度函数,获取关键字集聚区域,依据覆盖区域的句子权重,输出的最终偏重摘要。最后进行了评价实验,通过问答测验和相似比较,效果良好,而且表明偏重摘要对于多主题文本更为有效。 展开更多
关键词 计算机应用 中文信息处理 文本摘要 偏重摘要 同义扩充 段落匹配 分布密度
在线阅读 下载PDF
基于Siamese LSTM的中文多文档自动文摘模型 被引量:3
20
作者 龚永罡 王嘉欣 +1 位作者 廉小亲 裴晨晨 《计算机应用与软件》 北大核心 2021年第3期287-290,326,共5页
在文本信息数量迅速增长的环境下,为提升阅读效率,提出一种基于深度学习的多文档自动文本摘要模型。在传统文摘模型的基础上将Siamese LSTM深度学习网络应用到文本相似度计算中,计算曼哈顿距离来表征文本相似度,并采用去除停用词的方法... 在文本信息数量迅速增长的环境下,为提升阅读效率,提出一种基于深度学习的多文档自动文本摘要模型。在传统文摘模型的基础上将Siamese LSTM深度学习网络应用到文本相似度计算中,计算曼哈顿距离来表征文本相似度,并采用去除停用词的方法改进该网络模型以提升计算效率。实验结果表明,使用Siamese LSTM与传统余弦相似度等方法相比,生成的文摘在语义方面更贴近主题,质量更高,整个文摘系统的工作效率也显著提升。 展开更多
关键词 中文自动文摘 Siamese LSTM 自然语言处理 深度学习
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部