期刊文献+
共找到201篇文章
< 1 2 11 >
每页显示 20 50 100
基于Transformer和Text-CNN的日志异常检测
1
作者 尹春勇 张小虎 《计算机工程与科学》 北大核心 2025年第3期448-458,共11页
日志数据作为软件系统中最为重要的数据资源之一,记录着系统运行期间的详细信息,自动化的日志异常检测对于维护系统安全至关重要。随着大型语言模型在自然语言处理领域的广泛应用,基于Transformer的日志异常检测方法被广泛地提出。传统... 日志数据作为软件系统中最为重要的数据资源之一,记录着系统运行期间的详细信息,自动化的日志异常检测对于维护系统安全至关重要。随着大型语言模型在自然语言处理领域的广泛应用,基于Transformer的日志异常检测方法被广泛地提出。传统的基于Transformer的方法,难以捕捉日志序列的局部特征,针对上述问题,提出了基于Transformer和Text-CNN的日志异常检测方法LogTC。首先,通过规则匹配将日志转换成结构化的日志数据,并保留日志语句中的有效信息;其次,根据日志特性采用固定窗口或会话窗口将日志语句划分为日志序列;再次,使用自然语言处理技术Sentence-BERT生成日志语句的语义化表示;最后,将日志序列的语义化向量输入到LogTC日志异常检测模型中进行检测。实验结果表明,LogTC能够有效地检测日志数据中的异常,且在2个数据集上都取得了较好的结果。 展开更多
关键词 日志异常检测 深度学习 词嵌入 transformER text-CNN
在线阅读 下载PDF
中文短文本情感分类:融入位置感知强化的Transformer-TextCNN模型研究
2
作者 李浩君 王耀东 汪旭辉 《计算机工程与应用》 北大核心 2025年第11期216-226,共11页
针对当前中文短文本情感分类模型文本位置信息与关键特征获取不足的问题,提出了一种融入位置感知强化的Transformer-TextCNN情感分类模型。利用BERT可学习绝对位置编码与正弦位置编码强化模型的位置感知能力,融合Transformer的全局上下... 针对当前中文短文本情感分类模型文本位置信息与关键特征获取不足的问题,提出了一种融入位置感知强化的Transformer-TextCNN情感分类模型。利用BERT可学习绝对位置编码与正弦位置编码强化模型的位置感知能力,融合Transformer的全局上下文理解能力与TextCNN的局部特征捕捉能力,分别提取中文短文本全局特征与局部特征,构建位置感知强化与特征协同的情感特征输出服务,实现中文短文本情感准确分类。实验结果表明,该模型在视频弹幕数据集上的准确率达到90.23%,在SMP2020数据集上的准确率达到87.38%。相较于最优的基线模型,准确率在视频弹幕数据集和SMP2020数据集上分别提高了1.98和0.44个百分点,在中文短文本情感分类任务中取得更好的分类效果。 展开更多
关键词 文本情感分类 BERT transformER textCNN 位置编码
在线阅读 下载PDF
基于多层次嵌套Transformer的船名识别网络
3
作者 王腾 冼允廷 +2 位作者 徐浩 谢宋褀 邹全义 《计算机科学》 北大核心 2025年第6期179-186,共8页
船舶身份识别在水上目标监管中具有重要意义和广泛应用。船名是船舶身份识别的重要组成部分,准确识别船名可以弥补传统AIS身份识别方法的不足,提高船舶身份识别的准确率。与传统的中文文本识别相比,水上环境复杂,光照变化大,船体受腐蚀... 船舶身份识别在水上目标监管中具有重要意义和广泛应用。船名是船舶身份识别的重要组成部分,准确识别船名可以弥补传统AIS身份识别方法的不足,提高船舶身份识别的准确率。与传统的中文文本识别相比,水上环境复杂,光照变化大,船体受腐蚀严重,船名字体不规范,导致船名图像存在清晰度低、文字残缺、字体样式不一致等问题,进而使船名识别困难且准确率低。文中设计了一种基于多层次嵌套Transformer的轻量级识别网络,以解决船名识别中存在的问题。首先,通过空间变换网络对输入图片进行处理,纠正船名倾斜的情况;然后利用嵌套Transformer有效提取图像的多粒度特征;最后对文字和部首进行不同尺度的识别。实验结果显示,相比其他文字识别方法,所提算法在船名识别中表现优异;在CSLD数据集上,准确率达到了92.68%;在SCSLD数据集上,准确率达到了94.50%;在DCSLD数据集上,准确率达到了66.34%;同时,该方法具有低参数量和高帧率的特点。 展开更多
关键词 中文文本识别 船名识别 深度学习 场景文本识别 transformER
在线阅读 下载PDF
基于Transformer神经机器翻译的文本隐写方法
4
作者 金家立 马卫娇 +1 位作者 李晖 金纾羽 《计算机应用与软件》 北大核心 2025年第5期381-386,共6页
针对基于机器翻译的文本隐写方法存在的翻译质量差、隐藏容量低的问题,提出一种基于Transformer神经机器翻译的文本隐写方法。通过使用较为先进的神经机器翻译模型以及加入隐藏模块的Beam Search解码器,能够根据秘密信息在每一时间步输... 针对基于机器翻译的文本隐写方法存在的翻译质量差、隐藏容量低的问题,提出一种基于Transformer神经机器翻译的文本隐写方法。通过使用较为先进的神经机器翻译模型以及加入隐藏模块的Beam Search解码器,能够根据秘密信息在每一时间步输出与之对应的BPE编码,实现在翻译的过程中嵌入秘密信息。实验结果表明,该方法能够生成高质量、大隐藏容量的隐写译文。与以往的方法相比,BLEU值和隐藏容量分别提升4.84和1.63百分点。 展开更多
关键词 信息隐藏 文本隐写 机器翻译 transformER
在线阅读 下载PDF
基于RoBERTa和图增强Transformer的序列推荐方法 被引量:4
5
作者 王明虎 石智奎 +1 位作者 苏佳 张新生 《计算机工程》 CAS CSCD 北大核心 2024年第4期121-131,共11页
自推荐系统出现以来,有限的数据信息就一直制约着推荐算法的进一步发展。为降低数据稀疏性的影响,增强非评分数据的利用率,基于神经网络的文本推荐模型相继被提出,但主流的卷积或循环神经网络在文本语义理解和长距离关系捕捉方面存在明... 自推荐系统出现以来,有限的数据信息就一直制约着推荐算法的进一步发展。为降低数据稀疏性的影响,增强非评分数据的利用率,基于神经网络的文本推荐模型相继被提出,但主流的卷积或循环神经网络在文本语义理解和长距离关系捕捉方面存在明显劣势。为了更好地挖掘用户与商品之间的深层潜在特征,进一步提高推荐质量,提出一种基于Ro BERTa和图增强Transformer的序列推荐(RGT)模型。引入评论文本数据,首先利用预训练的Ro BERTa模型捕获评论文本中的字词语义特征,初步建模用户的个性化兴趣,然后根据用户与商品的历史交互信息,构建具有时序特性的商品关联图注意力机制网络模型,通过图增强Transformer的方法将图模型学习到的各个商品的特征表示以序列的形式输入Transformer编码层,最后将得到的输出向量与之前捕获的语义表征以及计算得到的商品关联图的全图表征输入全连接层,以捕获用户全局的兴趣偏好,实现用户对商品的预测评分。在3组真实亚马逊公开数据集上的实验结果表明,与Deep FM、Conv MF等经典文本推荐模型相比,RGT模型在均方根误差(RMSE)和平均绝对误差(MAE)2种指标上有显著提升,相较于最优对比模型最高分别提升4.7%和5.3%。 展开更多
关键词 推荐算法 评论文本 RoBERTa模型 图注意力机制 transformer机制
在线阅读 下载PDF
天津旧城更新中日常景观的记忆挖掘及空间转化 被引量:1
6
作者 张春彦 张新翊 侯天颖 《风景园林》 北大核心 2025年第3期23-31,共9页
【目的】存量时期下的旧城更新中,城市日常景观承载着丰富的地域文化和集体记忆,但因旧城更新进程滞后于民生设施建设,旧城景观丢失了重要的历史特征,同时因缺少宏观文化背景的指导,旧城更新存在同质化和割裂性等问题。需要寻找城市日... 【目的】存量时期下的旧城更新中,城市日常景观承载着丰富的地域文化和集体记忆,但因旧城更新进程滞后于民生设施建设,旧城景观丢失了重要的历史特征,同时因缺少宏观文化背景的指导,旧城更新存在同质化和割裂性等问题。需要寻找城市日常景观中不同时期记忆的多元载体,并针对不同载体进行记忆挖掘,建立记忆与日常景观空间的关联。【方法】以《欧洲风景公约》为理论基础,结合多维度的景观记忆关联实体,全面梳理老旧城区多种日常景观记忆载体,提出“10种载体,4种声源,3类数据”的多元景观记忆挖掘方法。将传统调研方法和数字技术结合,分析各时期旧城日常景观的活力分布及记忆情感,进而通过叙事景观呈现城区多重记忆。以天津老城厢为例进行日常景观记忆挖掘和空间转化分析。【结果】分析得到“热闹境”“市井气”“世俗地”3种情感空间的分布规律及景观特征,并结合城区发展现状,提出具有景观差异性、发展适应性、时空连续性和空间交互性的更新策略。【结论】老旧城区日常景观承载了集体对生活空间的景观性记忆,是一种共享的遗产。在旧城更新中,通过对日常景观记忆的挖掘和空间转化,提出日常景观遗产化的路径,促进场地文化和记忆的延续,为可持续的城市空间优化提供新方法。 展开更多
关键词 城市更新 日常景观 集体记忆 景观遗产化 小说文本 空间转化
在线阅读 下载PDF
基于标签构建与特征融合的多标签文本分类研究方法 被引量:1
7
作者 王旭阳 卢世红 《贵州师范大学学报(自然科学版)》 北大核心 2025年第1期105-114,共10页
目前存在的多标签文本分类任务算法,对于标签的建模不是很成熟,其中对于标签的依赖性问题,以及标签特征和文本特征的融合程度问题,均缺乏有效的处理方法。为了更有效地利用标签间的依赖关系,以及整合标签特征与文本特征的融合,提出了一... 目前存在的多标签文本分类任务算法,对于标签的建模不是很成熟,其中对于标签的依赖性问题,以及标签特征和文本特征的融合程度问题,均缺乏有效的处理方法。为了更有效地利用标签间的依赖关系,以及整合标签特征与文本特征的融合,提出了一种名为CGTCN的多标签文本分类模型。该模型从标签构建和特征融合的角度出发,通过CompGCN建模标签依赖关系,先利用Transformer中的多头交叉注意力机制初步融合标签特征和文本特征,然后再通过CorNet网络进一步捕获标签特征与文本特征之间的相关性,从而得到最终的标签预测。实验结果显示,与基准模型相比,该方法能够有效的提升模型性能,在多标签文本分类任务中取得更好的分类效果。 展开更多
关键词 多标签文本分类 CompGCN transformER CorNet 标签相关性
在线阅读 下载PDF
网络安全风险管理与企业数字化转型
8
作者 王正文 张青未 范斐 《中国软科学》 北大核心 2025年第7期145-156,共12页
近年来信息技术快速发展,数字化转型成为企业高质量发展的必由之路,然而信息红利背后网络安全威胁日益突出,实施网络安全风险管理至关重要。在此背景下,以2007—2023年中国A股上市企业为研究样本,实证考察企业实施网络安全风险管理对数... 近年来信息技术快速发展,数字化转型成为企业高质量发展的必由之路,然而信息红利背后网络安全威胁日益突出,实施网络安全风险管理至关重要。在此背景下,以2007—2023年中国A股上市企业为研究样本,实证考察企业实施网络安全风险管理对数字化转型的影响,并从异质性分析、渠道检验、经济后果检验3个方面进行拓展性讨论。研究发现,实施网络安全风险管理能够显著促进企业数字化转型。首次将网络安全风险管理与数字化转型纳入统一分析框架之中,不仅丰富了网络安全风险管理领域在中国情境下的研究,对于企业进一步完善网络安全风险管理、破解数字化转型困境也具有重要意义。 展开更多
关键词 网络安全风险管理 数字化转型 文本分析法
在线阅读 下载PDF
融合RNN与稀疏自注意力的文本摘要方法 被引量:1
9
作者 刘钟 唐宏 +1 位作者 王宁喆 朱传润 《计算机工程》 北大核心 2025年第1期312-320,共9页
随着深度学习的高速发展,基于序列到序列(Seq2Seq)架构的文本摘要方法成为研究焦点,但现有大多数文本摘要模型受限于长期依赖,忽略了注意力机制复杂度以及词序信息对文本摘要生成的影响,生成的摘要丢失关键信息,偏离原文内容与意图,影... 随着深度学习的高速发展,基于序列到序列(Seq2Seq)架构的文本摘要方法成为研究焦点,但现有大多数文本摘要模型受限于长期依赖,忽略了注意力机制复杂度以及词序信息对文本摘要生成的影响,生成的摘要丢失关键信息,偏离原文内容与意图,影响用户体验。为了解决上述问题,提出一种基于Transformer改进的融合递归神经网络(RNN)与稀疏自注意力的文本摘要方法。首先采用窗口RNN模块,将输入文本按窗口划分,每个RNN对窗口内词序信息进行压缩,并通过窗口级别的表示整合为整个文本的表示,进而增强模型捕获局部依赖的能力;其次采用基于递归循环机制的缓存模块,循环缓存上一文本片段的信息到当前片段,允许模型更好地捕获长期依赖和全局信息;最后采用稀疏自注意力模块,通过块稀疏矩阵对注意力矩阵按块划分,关注并筛选出重要令牌对,而不是在所有令牌对上平均分配注意力,从而降低注意力的时间复杂度,提高长文本摘要任务的效率。实验结果表明,该方法在数据集text8、enwik8上的BPC分数相比于LoBART模型降低了0.02,在数据集wikitext-103以及ptb上的PPL分数相比于LoBART模型分别降低了1.0以上,验证了该方法的可行性与有效性。 展开更多
关键词 序列到序列架构 文本摘要 transformer模型 递归神经网络 递归循环机制 稀疏自注意力机制
在线阅读 下载PDF
基于改进Transformer模型的文本摘要生成方法 被引量:11
10
作者 王侃 曹开臣 +2 位作者 徐畅 潘袁湘 牛新征 《电讯技术》 北大核心 2019年第10期1175-1181,共7页
传统的文本摘要方法,如基于循环神经网络和Encoder-Decoder框架构建的摘要生成模型等,在生成文本摘要时存在并行能力不足或长期依赖的性能缺陷,以及文本摘要生成的准确率和流畅度的问题。对此,提出了一种动态词嵌入摘要生成方法。该方... 传统的文本摘要方法,如基于循环神经网络和Encoder-Decoder框架构建的摘要生成模型等,在生成文本摘要时存在并行能力不足或长期依赖的性能缺陷,以及文本摘要生成的准确率和流畅度的问题。对此,提出了一种动态词嵌入摘要生成方法。该方法基于改进的Transformer模型,在文本预处理阶段引入先验知识,将ELMo(Embeddings from Language Models)动态词向量作为训练文本的词表征,结合此词对应当句的文本句向量拼接生成输入文本矩阵,将文本矩阵输入到Encoder生成固定长度的文本向量表达,然后通过Decoder将此向量表达解码生成目标文本摘要。实验采用Rouge值作为摘要的评测指标,与其他方法进行的对比实验结果表明,所提方法所生成的文本摘要的准确率和流畅度更高。 展开更多
关键词 文本摘要 transformer模型 先验知识 动态词向量 句向量
在线阅读 下载PDF
基于图像内容理解的判别性类别提示学习
11
作者 王楠井 刘阿建 +4 位作者 梁凤梅 张小梅 万军 谢珺 雷震 《电子学报》 北大核心 2025年第2期493-502,共10页
近年来,通过图像与文本的联合表示,基于对比语言-图像预训练(Contrastive Language-Image Pre-training,CLIP)的方法将文本信息作为分类器的权值,在通用图像识别任务中展现出卓越性能.但是现有方法仅单独构建类别文本提示,比如上下文优... 近年来,通过图像与文本的联合表示,基于对比语言-图像预训练(Contrastive Language-Image Pre-training,CLIP)的方法将文本信息作为分类器的权值,在通用图像识别任务中展现出卓越性能.但是现有方法仅单独构建类别文本提示,比如上下文优化(Context Optimization,CoOp)和条件上下文优化(Conditional Context Optimization,CoCoOp)等,没有考虑图像的内容语义信息与类别的重要性,限制了模型对图像类别的理解与判别.为了解决上述问题,本文在CLIP的基础上提出了一种新方法:基于图像内容理解的判别性类别提示学习(Discriminative Category Prompt Learning based on image content understanding,DCPL),借助图像中丰富的内容特征来学习文本提示,提高文本提示对类别的判别性.具体来说,DCPL包含提示生成(Prompt Generation,PG)模块和文本监督(Text Supervision,TS)模块.PG模块将图像特征和初始化的查询向量作为输入,通过自注意力机制和交叉注意力机制使输出的文本提示中包含充分的图像语义信息;TS模块将固定的类别提示模板作为监督,为可学习文本提示在类别层面和logits层面注入类别信息,增强了类别的重要性.最后,DCPL在ImageNet、Caltech101和Oxford-Pets等11个公开分类数据集上的16-shots平均准确率达到了81.84%,较以往最优方法Cross-Modal的平均准确率提升了0.98个百分点. 展开更多
关键词 视觉-语言模型 图像识别 提示调优 注意力机制 文本监督(TS) 适配器微调 transformER
在线阅读 下载PDF
新质生产力背景下数字化转型赋能体育企业高质量发展—基于体育行业上市公司的实证研究 被引量:7
12
作者 刘圣文 付珂语 +1 位作者 夏薇 李树旺 《上海体育大学学报》 北大核心 2025年第4期68-80,共13页
以2009—2022年A股体育产业上市公司作为研究样本,检验数字化转型如何赋能体育企业高质量发展及其影响的异质性与作用机理。发现:数字化转型显著促进了体育企业高质量发展,为体育产业形成新质生产力提供了关键支撑;数字化转型对高质量... 以2009—2022年A股体育产业上市公司作为研究样本,检验数字化转型如何赋能体育企业高质量发展及其影响的异质性与作用机理。发现:数字化转型显著促进了体育企业高质量发展,为体育产业形成新质生产力提供了关键支撑;数字化转型对高质量发展的作用在高新技术、成长期和成熟期、供应链效率高以及经营风险低的体育企业中更为显著,即数字化转型的效果存在“锦上添花”的优势捕获偏向;数字化转型能够通过提升数字成果和创新效率、缓解融资约束以及增强营运效能等多重路径,为体育企业新质生产力的培育和高质量发展提供内在动力。提出:在政府层面,应为体育产业数字化发展提供有针对性的细致化指导意见,注重在高等教育中培养“数字+体育”的复合型人才,鼓励发挥体育产业链数字化转型的协同优势;在企业层面,应谋划战略高度层面的数字化发展前景,建立开放合作的数字化生态系统,加强数字化人才培养和引进。 展开更多
关键词 新质生产力 数字化转型 体育产业 高质量发展 文本分析
在线阅读 下载PDF
融合方向感知Transformer的目标情感分析 被引量:1
13
作者 蔡瑞初 尹婉 许柏炎 《小型微型计算机系统》 CSCD 北大核心 2022年第11期2285-2292,共8页
基于目标的情感分析(Target-Based Sentiment Analysis)是情感分析领域最具有挑战性的课题之一,需要同时解决目标提取和特定目标情感分析两个子任务.现有研究工作仍存在两个问题:第一,模型无法充分利用目标边界和情感信息;第二,普遍采... 基于目标的情感分析(Target-Based Sentiment Analysis)是情感分析领域最具有挑战性的课题之一,需要同时解决目标提取和特定目标情感分析两个子任务.现有研究工作仍存在两个问题:第一,模型无法充分利用目标边界和情感信息;第二,普遍采用长短期记忆网络提取特征,无法捕抓输入句子的内部关系.为了解决上述问题,本文通过引入方向感知的Transformer,提出一种基于双辅助网络的目标情感分析模型DNTSA(Dual-assist Network based model for Target Sentiment Analysis),其核心思想是使用方向感知的Transformer作为特征提取器有效对齐多个目标词和情感词的内在联系,通过双辅助网络进一步增强模型的情感识别和目标提取能力.本文提出的方法在Laptop,Restaurant,Twitter 3个公开数据集上对比基准方法E2E-TBSA分别提升了2.3%,1.8%,3.9%的F1值. 展开更多
关键词 目标情感分析 transformER 文本表示 多任务学习 注意力机制
在线阅读 下载PDF
基于Transformer和重要词识别的句子融合方法
14
作者 谭红叶 李飞艳 《计算机应用与软件》 北大核心 2023年第7期145-150,共6页
句子融合是为多个句子生成言简意赅、符合语法的句子,可应用到自动摘要、复述生成等自然语言处理任务。目前句子融合方法已取得一定成效,但还存在重要信息缺失、语义偏离原句等问题。该文提出基于Transformer和重要词识别的方法来缓解... 句子融合是为多个句子生成言简意赅、符合语法的句子,可应用到自动摘要、复述生成等自然语言处理任务。目前句子融合方法已取得一定成效,但还存在重要信息缺失、语义偏离原句等问题。该文提出基于Transformer和重要词识别的方法来缓解上述问题。该方法包括两个模块,(1)重要词识别模块:利用序列标注模型识别原句重要词;(2)句子融合模块:将重要词与原句输入到Transformer框架并利用BERT进行语义表示,然后在全连接层引入基于原句和词表获得的向量作为先验知识进行句子融合。基于NLPCC2017摘要任务集构建句子融合数据集,并进行相关实验,结果表明所提方法的性能明显优于基线系统。 展开更多
关键词 句子融合 重要词 transformER 文本生成
在线阅读 下载PDF
政策工具视角下地方高校转型发展政策研究——基于165份政策文本的分析
15
作者 黄旭 《河北师范大学学报(教育科学版)》 北大核心 2025年第4期120-129,共10页
地方高校转型发展是推动高等教育分类发展、完善现代职业教育体系的重要举措。通过构建“政策工具-政策内容主题”二维分析框架,对165份地方高校转型相关文本进行分析发现,当前地方高校转型政策合力效应尚未形成、内涵界定尚未厘清、共... 地方高校转型发展是推动高等教育分类发展、完善现代职业教育体系的重要举措。通过构建“政策工具-政策内容主题”二维分析框架,对165份地方高校转型相关文本进行分析发现,当前地方高校转型政策合力效应尚未形成、内涵界定尚未厘清、共治机制亟待构建、政策协同效应不足。为进一步推进地方高校转型发展,未来应出台国家层面总体建设方案,统筹高校转型发展;统筹推进高校分类体系建设,明确高校分类标准;划定“政-校-企”法定权责,实现多主体共治;优化“工具-主题”组合配置,提升政策科学性。 展开更多
关键词 地方高校 转型发展 政策工具 政策文本分析
在线阅读 下载PDF
面向文本分类的transformer-capsule集成模型 被引量:16
16
作者 唐庄 王志舒 +3 位作者 周爱 冯美姗 屈雯 鲁明羽 《计算机工程与应用》 CSCD 北大核心 2020年第24期151-156,共6页
针对浅层的单模型文本分类算法不能很好地提取到文本序列多层次特征的问题,提出一种transformer-capsule集成模型,分别利用胶囊网络(capsule network)和transformer来提取文本的局部短语特征和全局语义特征,通过集成的形式更全面地得到... 针对浅层的单模型文本分类算法不能很好地提取到文本序列多层次特征的问题,提出一种transformer-capsule集成模型,分别利用胶囊网络(capsule network)和transformer来提取文本的局部短语特征和全局语义特征,通过集成的形式更全面地得到文本序列的多层次特征表示。此外,针对传统胶囊网络动态路由时存在部分噪音胶囊干扰的问题,提出基于注意力机制的动态路由算法,赋给噪音胶囊较小的权重,减少传递给后续胶囊的干扰信息,实验证明该机制能有效提高分类性能。选取文本分类通用语料库中4个单标签数据集和1个多标签Reuters-21578数据集进行实验,取得了较好的实验结果,其中在Reuters-21578上F1值相比Capsule-B模型提升了3.6%,达到了89.4%。 展开更多
关键词 文本分类 transformER 胶囊网络 集成模型
在线阅读 下载PDF
结合Transformer模型与深度神经网络的数据到文本生成方法 被引量:14
17
作者 许晓泓 何霆 +1 位作者 王华珍 陈坚 《重庆大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第7期91-100,共10页
数据到文本的生成是指从结构化数据生成连贯文本的一种自然语言处理方法。近年来,由于端到端训练的深度神经网络的应用,数据到文本生成的方法显示出了巨大潜力。该方法能够处理大量数据自动生成连贯性文本,常用于新闻写作、报告生成等... 数据到文本的生成是指从结构化数据生成连贯文本的一种自然语言处理方法。近年来,由于端到端训练的深度神经网络的应用,数据到文本生成的方法显示出了巨大潜力。该方法能够处理大量数据自动生成连贯性文本,常用于新闻写作、报告生成等场景。然而,已有研究中对于数据中具体数值、时间等数据信息的推理存在较大缺陷,无法充分利用数据间的结构信息给出合理的生成指引,并且生成过程容易出现语义与句法分离训练的问题。因此,文中提出一种结合Transformer模型与深度神经网络的数据到文本生成方法,并提出一个用于内容规划的Transformer Text Planning(TTP)算法,有效地解决上述问题。在Rotowire公开数据集上进行方法验证,实验结果表明,文中方法性能优于已有数据到文本生成模型,可直接应用于结构化数据到连贯性文本的生成任务中,具有一定的实际应用价值。 展开更多
关键词 文本生成 transformer模型 内容预选 内容规划 深度神经网络
在线阅读 下载PDF
全域土地综合整治政策的演进与转型——基于政策扩散和文本分析视角
18
作者 魏威 杨佳鑫 陈丹玲 《农林经济管理学报》 北大核心 2025年第3期451-459,共9页
基于全域土地综合整治的发展演变历程,采用政策扩散理论和文本分析方法,从双重视角分析政策的演进逻辑和转型特征。结果表明:全域土地综合整治政策经历了摸索、起步、快速发展和综合提升等4个演进阶段,呈现出从概念原始、目标单一、模... 基于全域土地综合整治的发展演变历程,采用政策扩散理论和文本分析方法,从双重视角分析政策的演进逻辑和转型特征。结果表明:全域土地综合整治政策经历了摸索、起步、快速发展和综合提升等4个演进阶段,呈现出从概念原始、目标单一、模式分散到概念丰富、目标多元、模式复杂的转型特征;整治政策既以决策导向作为核心驱动力,又以执行条件为现实基础,两者相互交织,共同推动政策的动态演进;采用Python语言对政策文本进行量化分析,发现相较于摸索阶段,全域土地综合整治政策的网络边数、网络密度、平均度分别提升了71.9%、70.8%、70.5%,网络特征从松散型向集聚型转变。据此,未来全域土地综合整治政策要守好“主阵地”,注重科学性;要下好“一盘棋”,强化系统性;要留好“提前量”,提升前瞻性,保障整治工作高质量推进。 展开更多
关键词 全域土地综合整治 演进逻辑 转型特征 政策扩散 文本分析
在线阅读 下载PDF
基于Transformer解码的端到端场景文本检测与识别算法 被引量:8
19
作者 郑金志 汲如意 +1 位作者 张立波 赵琛 《通信学报》 EI CSCD 北大核心 2023年第5期64-78,共15页
针对任意形状的场景文本检测与识别,提出一种新的端到端场景文本检测与识别算法。首先,引入了文本感知模块基于分割思想的检测分支从卷积网络提取的视觉特征中完成场景文本的检测;然后,由基于Transformer视觉模块和Transformer语言模块... 针对任意形状的场景文本检测与识别,提出一种新的端到端场景文本检测与识别算法。首先,引入了文本感知模块基于分割思想的检测分支从卷积网络提取的视觉特征中完成场景文本的检测;然后,由基于Transformer视觉模块和Transformer语言模块组成的识别分支对检测结果进行文本特征的编码;最后,由识别分支中的融合门融合编码的文本特征,输出场景文本。在Total-Text、ICDAR2013和ICDAR2015基准数据集上进行的实验结果表明,所提算法在召回率、准确率和F值上均表现出了优秀的性能,且时间效率具有一定的优势。 展开更多
关键词 文本检测 文本识别 端到端 transformER
在线阅读 下载PDF
面向混叠文字检测的单向投影Transformer方法 被引量:2
20
作者 冯智达 陈黎 《计算机应用》 CSCD 北大核心 2022年第12期3686-3691,共6页
针对基于分割的文字检测方法在混叠文字场景下性能下降的问题,提出了单向投影Transformer(SDPT)用于混叠文本检测。首先,使用深度残差网络(ResNet)和特征金字塔网络(FPN)提取并融合多尺度特征;然后,利用水平投影将特征图投影成向量序列... 针对基于分割的文字检测方法在混叠文字场景下性能下降的问题,提出了单向投影Transformer(SDPT)用于混叠文本检测。首先,使用深度残差网络(ResNet)和特征金字塔网络(FPN)提取并融合多尺度特征;然后,利用水平投影将特征图投影成向量序列,并送入Transformer模块进行建模,以挖掘文本行与行之间的关系;最后,使用多目标来进行联合优化。在合成数据集BDD-SynText和真实数据集RealText上进行了大量实验,结果表明,所提SDPT在高混叠度的文字检测下取得了最优的效果,而与PSENet等文本检测算法在相同骨干网络(ResNet50)条件下相比,在BDD-SynText上F1-Score(IoU75)至少提高了21.36个百分点,在RealText上的F1-Score(IoU75)至少提高了18.11个百分点,验证了所提方法对于混叠文字检测性能改善的重要作用。 展开更多
关键词 计算机视觉 深度学习 场景文字检测 混叠文字 投影 transformer算法
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部