期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
结合多尺度与多层级聚合的卷轴画图像描述模型
1
作者 乐超洋 胡文瑾 张福军 《现代电子技术》 北大核心 2025年第17期41-47,共7页
针对卷轴画图像的尺度大小不一且具有一定的空间分布特性以及基于Transformer的编码层容易丢失图像关键信息的问题,文中提出一种结合多尺度与多层级聚合的卷轴画图像描述模型(MMA)。在编码阶段,通过引入非对称卷积和多尺度特征模块,可... 针对卷轴画图像的尺度大小不一且具有一定的空间分布特性以及基于Transformer的编码层容易丢失图像关键信息的问题,文中提出一种结合多尺度与多层级聚合的卷轴画图像描述模型(MMA)。在编码阶段,通过引入非对称卷积和多尺度特征模块,可以有效提高卷积层获取空间信息的能力并融合卷轴画图像全局和局部的多尺度上下文信息,从而得到具有丰富语义信息的特征表示。在解码阶段,设计了多层级聚合网络,通过聚合不同编码层的特征实现高层编码层语义信息和低层编码层内容信息的有效利用,从而有效缓解信息丢失的问题。实验结果表明,该模型在卷轴画数据集上取得了不错效果,较NIC模型在BLEU-4、METEOR上分别提高了26.7%、0.9%,并生成准确性更高的描述语句。 展开更多
关键词 图像描述 卷轴画图像 多尺度特征 非对称卷积 多层级聚合解码 TRANSFORMER
在线阅读 下载PDF
基于多阶门控聚合网络的光学化学结构识别
2
作者 林帆 李建华 《计算机工程》 北大核心 2025年第8期364-372,共9页
在光学化学结构识别(OCSR)领域,现有基于深度学习的模型通常依赖于卷积神经网络(CNN)或视觉Transformer进行视觉特征提取,并采用Transformer进行序列解码。这些模型虽然有效,但仍受限于图像特征提取能力和解码时位置编码的精确性,从而... 在光学化学结构识别(OCSR)领域,现有基于深度学习的模型通常依赖于卷积神经网络(CNN)或视觉Transformer进行视觉特征提取,并采用Transformer进行序列解码。这些模型虽然有效,但仍受限于图像特征提取能力和解码时位置编码的精确性,从而影响识别效率。针对这些限制,将多阶门控聚合网络(MogaNet)和引入相对位置编码的Transformer构成的编码解码架构用于OCSR领域,提出一种基于多阶门控聚合网络的光学化学结构识别模型。该模型首先在图像特征提取时通过MogaNet空间聚合模块,捕获多尺度特征并减少特征冗余,并且通过MogaNet通道聚合模块改善通道维度的多样性;其次在序列解码时采用引入相对位置编码的Transformer作为解码器,精准捕捉序列单词之间的相对位置关系。为了训练和验证该模型,构建一个包含40万个分子的化学结构数据集,其中包含Markush结构与非Markush结构。实验结果表明,该模型的准确率达到了92.36%,优于其他现有的模型。 展开更多
关键词 光学化学结构识别 编码解码架构 深度学习 SMILES表达式 多阶门控聚合网络
在线阅读 下载PDF
基于压缩图像与YOLOv5模型的架空输电线路缺陷检测技术 被引量:2
3
作者 刘敏 姜亮 +2 位作者 田杨阳 张璐 陈岑 《沈阳工业大学学报》 北大核心 2025年第2期152-159,共8页
【目的】输电线路作为电能传输和使用过程中的重要环节,其安全稳定对电力系统的正常运行起着至关重要的作用,因此输电线路日常巡检具有重要作用。重大事故通常由微小缺陷隐患发展而来,日常巡检通常采用人工、无人机、可视化通道等手段,... 【目的】输电线路作为电能传输和使用过程中的重要环节,其安全稳定对电力系统的正常运行起着至关重要的作用,因此输电线路日常巡检具有重要作用。重大事故通常由微小缺陷隐患发展而来,日常巡检通常采用人工、无人机、可视化通道等手段,无论何种方式都需要处理大量可视化、红外或者紫外照片。但由于输电线路的特殊性,架设条件涉及多种环境,其巡检图像背景通常较为复杂,采用人工复核审查的方式精度较高,但对经验依赖较大且效率极低。如何快速、准确地识别架空线路巡检图片是架空输电线路缺陷识别的关键。传统输电线路巡检图片识别方法在复杂背景的干扰下,容易出现缺陷识别精确度不高的问题。【方法】为提高架空输电线路巡检图像复杂背景下的检测准确率,提出了一种兼顾识别效率和准确性的缺陷检测方法。基于压缩图像技术并结合YOLOv5模型,设计了一种基于稀疏卷积的非对称特征聚合压缩算法,将原始图像通过编码减少图像存储所需空间以便于存储和传输,经过信息通道传输到解密器后,再将压缩图像进行解码复原以提升局部集合特征的学习效率。同时,通过融入通道空间注意力模块从特征图中得到注意力通道权重矩阵和空间权重矩阵,并通过权重矩阵判断特征图区域的重要程度,完成对YOLOv5模型处理效率的提升。【结果】将压缩恢复后的图像输入改进YOLOv5模型中,利用通道注意力模块(CAM)和空间注意力模块(SAM)分别对图像进行通道与空间上的注意力数据处理,通过全局平均池化和最大池化处理增强目标区域的特征,并引入空间注意力模块增强通道注意力对特征位置信息的关注,以检测出存在缺陷的设备,并通过实验验证了方法的有效性。【结论】以某架空线路的巡检图像数据集为基础,对检测方法开展训练与测试,结果表明,巡检图像经所提技术压缩后,尺寸明显减小,恢复后的图像尺寸较原图约降低了3 MB且未出现失真;改进YOLOv5模型具有较高的检测精确度,其检测准确率和时间分别为0.91和0.87 s,算法在降低图像尺寸提升检测速度的同时保证了检测准确率。 展开更多
关键词 架空输电线路 缺陷检测 图像压缩 改进YOLOv5模型 非对称特征聚合编解码网络 通道空间注意力模块 逐通道稀疏残差卷积 检测准确率
在线阅读 下载PDF
基于多路信息聚合协同解码的单通道语音增强 被引量:1
4
作者 莫尚斌 王文君 +2 位作者 董凌 高盛祥 余正涛 《计算机应用》 CSCD 北大核心 2024年第8期2611-2617,共7页
为了改善基于卷积编解码架构的单通道语音增强网络对语音声学特征提取不充分、解码特征丢失严重的问题,提出一种基于多路信息聚合协同解码的单通道语音增强网络MIACD,通过双路编码器充分提取融入了语音自监督学习(SSL)表征的幅度谱和复... 为了改善基于卷积编解码架构的单通道语音增强网络对语音声学特征提取不充分、解码特征丢失严重的问题,提出一种基于多路信息聚合协同解码的单通道语音增强网络MIACD,通过双路编码器充分提取融入了语音自监督学习(SSL)表征的幅度谱和复数谱特征,由4层Conformer分别从时间和频率维度对提取特征建模,采用残差连接将双路编码器提取的语音幅度、复数特征引入三路信息聚合解码器,并利用所提通道-时频注意力(CTF-Attention)机制根据语音能量分布情况调节解码器中聚合信息,有效缓解解码时可用声学信息缺失严重的问题。在公开数据集Voice Bank DEMAND上的实验结果表明,与用于单通道语音增强的协作学习框架(GaGNet)相比,MIACD在客观评价指标宽带感知评估语音质量(WB-PESQ)上提升了5.1%,短时客观可懂度(STOI)达到96.7%,验证所提方法可充分利用语音信息重构信号,有效抑制噪声并提升语音可理解性。 展开更多
关键词 声学特征 多路信息聚合 双路编码器 三路信息聚合解码器 通道-时频注意力机制
在线阅读 下载PDF
基于信息融合和数据增强的篇章级事件检测方法
5
作者 谭立君 胡艳丽 +1 位作者 曹健威 谭真 《计算机科学与探索》 CSCD 北大核心 2024年第11期3015-3026,共12页
事件检测是自然语言处理领域的关键任务,旨在识别事件触发词并正确分类其事件类型。语句级事件检测方法未能有效利用文本中的句内和句间事件相关性信息,面临着一词多义、事件共现等众多难题。此外,基于神经网络的事件检测模型需要大量... 事件检测是自然语言处理领域的关键任务,旨在识别事件触发词并正确分类其事件类型。语句级事件检测方法未能有效利用文本中的句内和句间事件相关性信息,面临着一词多义、事件共现等众多难题。此外,基于神经网络的事件检测模型需要大量的文本数据作为训练支撑,但语料库的数据不足严重影响着结果的准确率及模型的稳定性。针对上述问题,提出了基于信息融合和数据增强的篇章级事件检测方法LGIA。该方法采用编-解码框架,设计了基于膨胀卷积网络的句子级局部信息抽取模块和基于条件层归一化的篇章级全局信息抽取模块,以深入挖掘整个文档的上下文语义信息和事件间的相关性。同时,采用了同义词替换的数据增强策略,有效扩充了数据样本,从而缓解了数据不足问题带来的影响。经实验验证,LGIA方法在ACE2005数据集上取得了较好的结果,并在数据增强后的TAC-KBP2017数据集上得到了显著的性能提升,F1值分别达到了77.6%和65.3%,相较于现有的基线方法展现出了更优越的性能表现。 展开更多
关键词 事件检测 信息融合 数据增强 编码-解码框架
在线阅读 下载PDF
基于分层解码和渐进融合的快速显著性目标检测 被引量:1
6
作者 杨爱萍 王子麒 +1 位作者 程思萌 刘彦 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2024年第7期721-728,共8页
现有显著性目标检测方法大多只关心模型的检测精度,容易忽略模型的编解码效率,导致网络运行速度较慢.针对上述问题,本文提出一种基于分层解码和渐进融合的快速显著性目标检测网络,并分别设计语义提取模块、空间增强模块和边界提取模块,... 现有显著性目标检测方法大多只关心模型的检测精度,容易忽略模型的编解码效率,导致网络运行速度较慢.针对上述问题,本文提出一种基于分层解码和渐进融合的快速显著性目标检测网络,并分别设计语义提取模块、空间增强模块和边界提取模块,对编码器提取到的多尺度特征进行分层筛选和高效解码.其中,语义提取模块可准确定位显著性目标的整体区域,空间增强模块可完整保留显著性目标的空域信息,边界提取模块可增强显著性目标的边界轮廓.由于不同层级特征的感受野和分辨率不同,本文设计了邻间聚合模块和边界细化模块,对筛选后的特征进行渐进式融合并逐步细化得到最后的显著性预测图.实验结果表明,所提方法不仅能够得到边界清晰、区域完整的显著性预测图,还能显著提升模型的编解码效率,快速检测显著性目标,在ECSSD和HKU-IS数据集上的最大值F max分别为0.947和0.936,优于其他方法. 展开更多
关键词 显著性目标检测 分层解码 渐进融合 邻间聚合 边界细化
在线阅读 下载PDF
基于双流增强编码和注意优化解码的图像篡改定位算法
7
作者 朱叶 赵晓祥 于洋 《液晶与显示》 CAS CSCD 北大核心 2024年第8期1103-1115,共13页
主流图像篡改定位方法通常通过简单操作融合不同流的不一致特征,导致特征冗余且篡改区域的像素误检。基于此,本文提出基于双流增强编码和注意优化解码的图像篡改定位框架。首先,提出双流增强编码分别对图像和频域特征进行基于噪声和通... 主流图像篡改定位方法通常通过简单操作融合不同流的不一致特征,导致特征冗余且篡改区域的像素误检。基于此,本文提出基于双流增强编码和注意优化解码的图像篡改定位框架。首先,提出双流增强编码分别对图像和频域特征进行基于噪声和通道注意力的自增强和基于特征映射的交叉注意权重的交互增强。随后,引入多级感受野策略探索多尺度上下文信息,设计邻阶特征聚合模块融合多尺度相邻特征。最后,利用篡改区域和非篡改区域协同增强模型的篡改定位能力,提出注意优化解码模块,消除初始篡改区域预测中边缘像素的错误预测,逐步精确细化篡改定位。在4个主流公共基准数据集NIST16、Coverage、Columbia、CASIA和两个现实挑战数据集IMD20、Wild上与主流篡改定位方法进行对比,本文算法在无微调模型和微调模型两个设置下,在6个数据集上的性能最优,证明本文提出的篡改定位网络能够充分利用多种篡改线索,在不同的篡改数据集上实现篡改区域的有效定位,具有更高的定位精度和更强的鲁棒性。 展开更多
关键词 图像篡改定位 双流增强编码 注意优化解码 邻阶特征聚合
在线阅读 下载PDF
虚拟聚合与精准解码:农村广播大喇叭在突发疫情传播中的政治功能 被引量:8
8
作者 郭淼 郝静 《新闻与传播评论》 CSSCI 2021年第2期98-105,共8页
2020年初新型冠状病毒肺炎所引发的重大公共卫生风险,使隔离人员、信息畅达成为防控疫情、维护秩序稳定、防范次生风险的首要任务。农村因春节期间返乡人数激增成为防控关键区域,对返乡流动人口及留守村民的疫情管控是基层社会治理的难... 2020年初新型冠状病毒肺炎所引发的重大公共卫生风险,使隔离人员、信息畅达成为防控疫情、维护秩序稳定、防范次生风险的首要任务。农村因春节期间返乡人数激增成为防控关键区域,对返乡流动人口及留守村民的疫情管控是基层社会治理的难点。为实现精准的防疫信息传播,有效发挥风险预警的作用,广播大喇叭成为农村疫情预警和疫情期间隔离管控等信息传播的重要手段,是通过精准解码缩小政治信息鸿沟、垂直到村以增强个体理解、激活政治参与意识的工具,是规范性政治权力虚拟聚合、政治信息传播仪式化的表征,是基层政治治理的隐喻符号。“溢散”和“共鸣”使新媒体与农村广播大喇叭实现联动,二次传播增强了政治传播效果,创新了基层治理手段,为引导社会舆情,防范社会风险,提升基层治理水平和治理能力现代化发挥了重要作用。 展开更多
关键词 农村广播大喇叭 虚拟聚合 精准解码 政治传播 风险预警
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部