期刊文献+
共找到104篇文章
< 1 2 6 >
每页显示 20 50 100
编码器-解码器结构的刀具磨损状态预测研究
1
作者 刘本刚 吴文江 +2 位作者 赵丹 王裴岩 彭春杨 《小型微型计算机系统》 北大核心 2025年第6期1530-1536,共7页
针对航空钛合金加工中刀具磨损状态监测难题,提出了面向刀具磨损状态预测的编码器-解码器网络结构,构建了Transformer、BiLSTM、BiGRU等72种组合模型,通过在航空钛合金高效加工实测数据样本集上验证发现:以Transformer为编码器的模型性... 针对航空钛合金加工中刀具磨损状态监测难题,提出了面向刀具磨损状态预测的编码器-解码器网络结构,构建了Transformer、BiLSTM、BiGRU等72种组合模型,通过在航空钛合金高效加工实测数据样本集上验证发现:以Transformer为编码器的模型性能最优,其中Transformer-BiGRU组合模型F1值达69.61%,显著优于GS-XGBoost(58.01%)、Attention-CNN(57.65%)等方法,研究表明基于编码器-解码器的刀具状态预测模型在航空钛合金复杂切削工况下具有显著优势,未来可通过模型优化和扩充样本数据进一步提升其性能. 展开更多
关键词 编码器-解码器结构 刀具磨损状态预测 TRANSFORMER 双向循环神经网络 航空钛合金高效加工
在线阅读 下载PDF
基于结构化案例推理的SQL生成模型
2
作者 罗明全 王静 魏英 《无线电通信技术》 北大核心 2025年第3期478-485,共8页
自动化的自然语言与数据库接口对于应用开发至关重要。语义解析驱动的推理时间结构化查询语言(Structured Query Language,SQL)自适应方法能够兼容来自新域的样本,且无需重复调优。现有方法通常简单地将编码器输入的新域输入-输出案例... 自动化的自然语言与数据库接口对于应用开发至关重要。语义解析驱动的推理时间结构化查询语言(Structured Query Language,SQL)自适应方法能够兼容来自新域的样本,且无需重复调优。现有方法通常简单地将编码器输入的新域输入-输出案例连接到模型中,进而使解码器产生偏差,不能充分利用案例中逻辑形式的结构。基于上述情况,提出一种基于结构化案例推理(Structured Case Reasoning Model,SCRM)的SQL生成模型,充分利用案例的逻辑形式和候选输出之间的子树级相似性,以此生成更好的解码器决策;提出一个可训练的组合子树相似函数,与全树嵌入相比,该函数对于大型搜索边界的评分更为准确。SCRM结合新的结构化案例记忆及可训练的查询子树相似度模块,可以提升推理过程中正确输出的得分。在5种不同的数据集上进行实验,相对于其他模型,所提出的SCRM凭借结构化案例的优势,在不同性能指标上均取得了最佳结果。 展开更多
关键词 Text-to-SQL 子树级相似性 结构化案例 解码器 相似函数
在线阅读 下载PDF
基于DB-PATNet的棉布瑕疵小样本语义分割
3
作者 杨正达 李波 +2 位作者 苏莲花 姚为 田淙文 《计算机工程与设计》 北大核心 2025年第6期1803-1809,共7页
针对棉布生产中棉布瑕疵的小样本特点,采用小样本学习的方法,在PATNet基础上提出一种双分支小样本语义分割网络DB-PATNet。基于瑕疵样本低对比度和尺度差异大的特点,提出双分支解码器结构和双向指导策略;引入结合自注意力的特征转换模块... 针对棉布生产中棉布瑕疵的小样本特点,采用小样本学习的方法,在PATNet基础上提出一种双分支小样本语义分割网络DB-PATNet。基于瑕疵样本低对比度和尺度差异大的特点,提出双分支解码器结构和双向指导策略;引入结合自注意力的特征转换模块,增强模型对新类样本和新域样本的泛化能力。实验结果表明,DB-PATNet网络的mIoU在5-shot设置中相较于PATNet网络提升了2.67%,相比RePRI网络提升了8.84%。在跨域实验中,mIoU在1-shot设置中达到了57.61%,在5-shot设置中达到了64.43%,接近常规语义分割网络的性能。 展开更多
关键词 棉布瑕疵 小样本学习 语义分割 双分支解码器结构 双向指导策略 自注意力 特征转换
在线阅读 下载PDF
基于多语义特征回复生成网络的任务型对话
4
作者 姚震 杨州 +2 位作者 廖祥文 陈志豪 姚孟韬 《中文信息学报》 北大核心 2025年第7期91-101,共11页
任务型对话旨在实现机器与用户间的问答交互,进而完成用户提出的特定要求。现有方法主要利用用户对话领域或对话动作等单一特征完成回复解码操作,这种单一类型的特征使得模型学习到的语义信息较为片面,模型无法生成全面的候选回复,导致... 任务型对话旨在实现机器与用户间的问答交互,进而完成用户提出的特定要求。现有方法主要利用用户对话领域或对话动作等单一特征完成回复解码操作,这种单一类型的特征使得模型学习到的语义信息较为片面,模型无法生成全面的候选回复,导致回复成功率和准确度较低。因此,该文提出一种基于多语义特征回复生成网络的对话模型。首先为全局语义信息和两类语义特征(对话领域、对话动作)分别构建一个双向门控循环网络作为回复生成网络;随后三个回复生成网络进行解码操作获得包含多类语义特征信息的候选回复集合;最后自适应选择网络通过计算比对,筛选出语义信息丰富且满足用户需要的候选回复作为最终回复。该方法融合对话领域和对话动作两类语义特征信息,提高了回复成功率和准确度,在MultiWOZ 2.0和MultiWOZ 2.1两个公开数据集上的实验结果表明,该方法明显优于基准模型。 展开更多
关键词 任务型对话系统 端到端结构 多回复解码器 多语义特征
在线阅读 下载PDF
广域作物种植种类解析技术
5
作者 郭佳希 姚竟发 滕桂法 《中国农机化学报》 北大核心 2025年第9期352-360,共9页
实时精准获取田间土地信息是农业管理部门有效落实种植计划与监管的重要手段与关键环节。为克服基于无人机影像的农田分类中面临的精度不足、边缘模糊以及效率低下等问题,融合无人机图像处理及深度学习技术,改进DeepLabV3+网络模型。首... 实时精准获取田间土地信息是农业管理部门有效落实种植计划与监管的重要手段与关键环节。为克服基于无人机影像的农田分类中面临的精度不足、边缘模糊以及效率低下等问题,融合无人机图像处理及深度学习技术,改进DeepLabV3+网络模型。首先引入轻量级网络MS—MobileNetV2替代原有主干,显著提升识别效率;其次集成ECANet模块,有效抑制背景干扰因素,使模型专注于作物信息的提取;最后调整ASPP的膨胀率,级联不同尺度的信息,增强特征抓取能力。选取蠡县周边农田作为研究区域,利用无人机正射影像构建数据集,进行对比试验。结果表明:所提方法在玉米、山药、荒地、乔木、菜地的分类精度上分别提高0.7%、1.15%、5.04%、2.59%、0.95%,并且减少87.8%的参数量和50.5%的训练用时。 展开更多
关键词 广域作物 无人机 深度分离卷积 编解码结构 特征融合 高效通道注意力
在线阅读 下载PDF
基于多阶门控聚合网络的光学化学结构识别
6
作者 林帆 李建华 《计算机工程》 北大核心 2025年第8期364-372,共9页
在光学化学结构识别(OCSR)领域,现有基于深度学习的模型通常依赖于卷积神经网络(CNN)或视觉Transformer进行视觉特征提取,并采用Transformer进行序列解码。这些模型虽然有效,但仍受限于图像特征提取能力和解码时位置编码的精确性,从而... 在光学化学结构识别(OCSR)领域,现有基于深度学习的模型通常依赖于卷积神经网络(CNN)或视觉Transformer进行视觉特征提取,并采用Transformer进行序列解码。这些模型虽然有效,但仍受限于图像特征提取能力和解码时位置编码的精确性,从而影响识别效率。针对这些限制,将多阶门控聚合网络(MogaNet)和引入相对位置编码的Transformer构成的编码解码架构用于OCSR领域,提出一种基于多阶门控聚合网络的光学化学结构识别模型。该模型首先在图像特征提取时通过MogaNet空间聚合模块,捕获多尺度特征并减少特征冗余,并且通过MogaNet通道聚合模块改善通道维度的多样性;其次在序列解码时采用引入相对位置编码的Transformer作为解码器,精准捕捉序列单词之间的相对位置关系。为了训练和验证该模型,构建一个包含40万个分子的化学结构数据集,其中包含Markush结构与非Markush结构。实验结果表明,该模型的准确率达到了92.36%,优于其他现有的模型。 展开更多
关键词 光学化学结构识别 编码解码架构 深度学习 SMILES表达式 多阶门控聚合网络
在线阅读 下载PDF
基于卷积调制与空间协作的水下图像增强 被引量:2
7
作者 郭伟 王欣哲 +1 位作者 王江达 王春艳 《计算机工程》 CAS CSCD 北大核心 2024年第8期310-318,共9页
针对光线在水中的散射和吸收效应造成水下图像纹理和结构不清晰的问题,提出一种基于卷积调制(CM)与空间协作(SC)的水下图像增强算法。以编码器-解码器作为基础网络,使用RepVGG的浅层和深层网络分别提取水下图像的纹理和结构特征。首先,... 针对光线在水中的散射和吸收效应造成水下图像纹理和结构不清晰的问题,提出一种基于卷积调制(CM)与空间协作(SC)的水下图像增强算法。以编码器-解码器作为基础网络,使用RepVGG的浅层和深层网络分别提取水下图像的纹理和结构特征。首先,特征主导网络将RepVGG中提取到的水下图像特征转化成具有不同尺度的纹理和结构特征,使其与解码器中的特征图进行拼接融合。其次,在编码器中使用卷积调制模块,采用深度可分离卷积(DSConv)模拟自注意力机制的方式减少图像细节信息的丢失,提高编码器特征提取的能力。最后,在解码器中使用空间协作卷积(SCConv),在空间维度上处理水下特征保留更多的位置信息,以提高解码器对融合后特征的增强能力。实验结果表明,该算法在视觉感知与性能指标上优于对比算法,峰值信噪比(PSNR)和结构相似性(SSIM)指标最高达到23.4465 dB和0.8946,水下彩色图像质量评价(UCIQE)和水下图像质量测量(UIQM)指标最高达到0.5826和3.0689,进一步证明了该算法能够有效增强水下图像的纹理和结构特征,具有较好的视觉感知效果。 展开更多
关键词 图像处理 水下图像增强 卷积调制 空间协作 编解码结构
在线阅读 下载PDF
全尺度密集卷积U型网络的视网膜血管分割算法 被引量:1
8
作者 夏平 何志豪 +2 位作者 雷帮军 彭程 王雨蝶 《计算机工程与设计》 北大核心 2024年第3期866-873,共8页
针对视网膜图像中血管尺度跨度大、细小血管与背景高度相似导致误分割和未分割等问题,提出一种全尺度密集卷积U型网络的视网膜血管分割方法。为提取更复杂的特征信息,构建级联卷积融合密集块(cascade convolutional fusion dense blocks... 针对视网膜图像中血管尺度跨度大、细小血管与背景高度相似导致误分割和未分割等问题,提出一种全尺度密集卷积U型网络的视网膜血管分割方法。为提取更复杂的特征信息,构建级联卷积融合密集块(cascade convolutional fusion dense blocks, CCF-DB)作为U型网络的编解码器用以提取视网膜血管的特征信息;在网络最底端嵌入混合注意力级联卷积密集块(mixed attention cascaded convolutional dense block, MACC-DB),进一步提升感受野,获取更高维的语义特征信息;在模型的解码部分采用全尺度的跳跃连接,捕获不同尺度下的血管特征信息,提升模型的分割精度。实验结果表明,在DRIVE数据集上,相比于U-Net、U-Net3+、SA-Unet、FR-Unet等算法,此算法的AUC值达到了98.26%,准确率为95.82%;在CHASE-DB1数据集上,此算法的AUC值达98.84%,准确率达96.66%。采用此算法进行视网膜血管分割,分割的精度和鲁棒性均有不同程度的提升,对细小血管分割达到了优良的效果。 展开更多
关键词 医学图像分割 深度学习 视网膜血管分割 全尺度密集卷积 编解码结构 混合注意力 级联卷积
在线阅读 下载PDF
基于改进SegNet的鸡只检测算法 被引量:2
9
作者 吉训生 孙贝贝 夏圣奎 《计算机工程与设计》 北大核心 2024年第1期102-109,共8页
为实现智能化检测出鸡场中死亡鸡只,提出一种基于改进语义分割模型AT-SegNet的鸡只检测算法。基于对称编码解码结构SegNet,利用空洞卷积在解码前聚合不同感受野的上下文信息,设计一种三尺度注意力级联融合模块,以并联方式嵌入编、解码器... 为实现智能化检测出鸡场中死亡鸡只,提出一种基于改进语义分割模型AT-SegNet的鸡只检测算法。基于对称编码解码结构SegNet,利用空洞卷积在解码前聚合不同感受野的上下文信息,设计一种三尺度注意力级联融合模块,以并联方式嵌入编、解码器间,丰富解码器信息。利用多层深度可分离卷积替代标准卷积,提取深层次语义信息,减少计算量提高实时性。将鸡群图像分割结果交并比与阈值对比判别鸡只状态。实验结果表明,改进的AT-SegNet较原算法的检测精度提高了25.17%,能够在复杂鸡群环境中准确、高效地发现死亡鸡只。 展开更多
关键词 深度学习 鸡只检测 语义分割 编码解码结构 注意力机制 软池化 深度可分离卷积
在线阅读 下载PDF
基于视觉Transformer和双解码器的红外小目标检测方法 被引量:1
10
作者 代少升 刘科生 +3 位作者 黄炼 贺自强 毛兴华 任汶皓 《红外技术》 CSCD 北大核心 2024年第9期1070-1080,共11页
当前基于卷积神经网络的红外小目标检测方法在编码器阶段受限于感受野,且解码器在多尺度特征融合中缺乏有效的特征交互。本文提出了一种基于编码器-解码器结构的新方法,针对现有红外小目标检测方法中的问题进行改进。该方法使用视觉Tran... 当前基于卷积神经网络的红外小目标检测方法在编码器阶段受限于感受野,且解码器在多尺度特征融合中缺乏有效的特征交互。本文提出了一种基于编码器-解码器结构的新方法,针对现有红外小目标检测方法中的问题进行改进。该方法使用视觉Transformer作为编码器,能够有效地提取红外小目标图像的多尺度特征。视觉Transformer是一种新兴的深度学习架构,其通过自注意力机制捕捉图像中像素之间的全局关系,以处理长程依赖性和上下文信息。此外,本文还设计了一个由交互式解码器和辅助解码器组成的双解码器模块,旨在提高解码器对红外小目标的重构能力。该双解码器模块能够充分利用不同特征之间的互补信息,促进深层特征和浅层特征之间的交互,并通过将两个解码器的结果进行叠加,以更好地重构红外小目标。在广泛使用的公共数据集上的实验结果表明,本文提出的方法在F1和mIoU两个评价指标上的性能优于其他对比方法。 展开更多
关键词 红外小目标检测 视觉Transformer 多尺度特征融合 编解码结构
在线阅读 下载PDF
基于多尺度注意力的生成式信息隐藏算法
11
作者 刘丽 侯海金 +1 位作者 王安红 张涛 《计算机应用》 CSCD 北大核心 2024年第7期2102-2109,共8页
针对现有生成式信息隐藏算法嵌入容量低且提取的秘密图像视觉质量欠佳的问题,提出基于多尺度注意力的生成式信息隐藏算法。首先,设计基于多尺度注意力的双编码-单解码生成器,载体图像与秘密图像的特征在编码端分两个支路独立提取,在解... 针对现有生成式信息隐藏算法嵌入容量低且提取的秘密图像视觉质量欠佳的问题,提出基于多尺度注意力的生成式信息隐藏算法。首先,设计基于多尺度注意力的双编码-单解码生成器,载体图像与秘密图像的特征在编码端分两个支路独立提取,在解码端通过多尺度注意力模块进行融合,并利用跳跃连接为解码端提供不同尺度的细节特征,从而获得高质量的载密图像。其次,在U-Net结构的提取器中引入自注意力模块,以弱化载体图像特征、增强秘密图像深层特征,并利用跳跃连接弥补秘密图像细节特征,提高秘密信息提取的准确率;同时,多尺度判决器与生成器的对抗训练可以有效提升载密图像的视觉质量。实验结果表明,所提算法在嵌入容量为24 bpp的情况下,生成的载密图像峰值信噪比(PSNR)和结构相似性(SSIM)平均可达到40.93 dB和0.9883,且提取的秘密图像PSNR和SSIM平均可达到30.47 dB和0.9543。 展开更多
关键词 信息隐藏 注意力机制 多尺度 编码-解码结构 生成对抗网络
在线阅读 下载PDF
基于密集残差网络的图像隐藏方案 被引量:1
12
作者 陈立峰 刘佳 +2 位作者 潘晓中 孙文权 董炜娜 《科学技术与工程》 北大核心 2024年第9期3719-3726,共8页
针对基于编-解码器网络的图像隐写方案生成的含密图像和消息图像质量不高的问题,提出了一种新的基于密集残差连接的编码器-解码器隐写方案,与现有的端到端图像隐写网络不同,所提方案无须对图像进行预处理,采用密集残差连接,将浅层网络... 针对基于编-解码器网络的图像隐写方案生成的含密图像和消息图像质量不高的问题,提出了一种新的基于密集残差连接的编码器-解码器隐写方案,与现有的端到端图像隐写网络不同,所提方案无须对图像进行预处理,采用密集残差连接,将浅层网络的特征输送到深层网络结构的每一层,有效地保留了特征图的细节信息,并使用通道和空间注意力模块对特征进行筛选,提高了编-解码器对图像复杂纹理区域的关注度。在LFW、PASCAL-VOC12和ImageNet数据集的实验结果表明,在保证算法安全性的前提下,所提方法能够有效提高图像质量,含密图像和载体图像的峰值信噪比(peak signal-to-noise ratio,PSNR)和结构相似性(structural similarity,SSIM)的平均值最高达到了36.2 dB和0.98。 展开更多
关键词 信息隐藏 深度学习 注意力机制 编码-解码结构 密集残差网络
在线阅读 下载PDF
基于跨层次聚合网络的实时城市街景语义分割 被引量:1
13
作者 侯志强 程敏婕 +2 位作者 马素刚 屈敏杰 杨小宝 《光学精密工程》 EI CAS CSCD 北大核心 2024年第8期1212-1226,共15页
随着自动驾驶技术的迅速发展,精确高效的场景理解显得尤为重要。城市街景语义分割旨在准确识别并分割出行人、障碍物、道路和标志物等要素,为自动驾驶技术提供必要的道路信息。然而,当前的语义分割算法在城市街景分割中仍然面临一些挑战... 随着自动驾驶技术的迅速发展,精确高效的场景理解显得尤为重要。城市街景语义分割旨在准确识别并分割出行人、障碍物、道路和标志物等要素,为自动驾驶技术提供必要的道路信息。然而,当前的语义分割算法在城市街景分割中仍然面临一些挑战,主要表现为不同类别的像素区分不够清晰、对于复杂场景结构的理解不够精准以及对小尺度对象或大尺度结构的分割不准确等问题。为此,本文提出一种基于跨层次聚合网络的实时城市街景语义分割算法。首先,在编码器末端设计了结合跨层次聚合的金字塔池化模块,用于高效提取多尺度上下文信息;其次,在编码器和解码器之间设计了跨层次聚合模块,通过引入通道注意力机制增强信息的表征能力,逐级聚合编码器阶段的特征以充分实现特征复用;最后,在解码器阶段设计了多尺度融合模块,在通道维度聚合全局信息与局部信息,促进深层特征与浅层特征的融合。将所提算法在两个通用的城市街景数据集上进行了验证。在一张RTX3090显卡上(TensorRT测速环境),本文算法在Cityscapes测试集以294 FPS的实时性达到73.0%mIoU的准确性,在更高分辨率的图像上以164 FPS的实时性达到75.8%mIoU的准确性;在CamVid数据集以239 FPS的实时性达到74.8%mIoU的准确性。实验结果表明,本文算法在准确性与实时性之间取得了有效平衡,对比其他算法的语义分割性能具有显著提升,为实时城市街景语义分割领域带来了新的突破。 展开更多
关键词 语义分割 卷积神经网络 城市街景 编码器-解码器结构 金字塔池化模块
在线阅读 下载PDF
基于树形解码器的航空术语DEF自动生成
14
作者 吕嘉 王裴岩 +2 位作者 蔡东风 张桂平 李林娜 《中文信息学报》 CSCD 北大核心 2024年第6期24-33,共10页
该文研究了基于HowNet的KDML语法体系的术语DEF自动生成问题,提出一种基于树形解码器的生成方法。在编码器端输入专业术语以及其他外部信息(术语的定义、术语子词的义原等);在解码器端交替使用义原解码器和关系解码器,同时使用注意力机... 该文研究了基于HowNet的KDML语法体系的术语DEF自动生成问题,提出一种基于树形解码器的生成方法。在编码器端输入专业术语以及其他外部信息(术语的定义、术语子词的义原等);在解码器端交替使用义原解码器和关系解码器,同时使用注意力机制关注编码器端的各种表征信息,最终得到“义原-关系-义原”形式的输出,并组合成术语对应的义原树,进而得到术语的DEF表示以辅助专业领域HowNet的构建,最终取得了首义原F_(1)值74.13%、总义原F_(1)值53.92%、总关系F_(1)值53.33%、总三元组F_(1)值30.48%的结果。 展开更多
关键词 知网 DEF生成 树形结构解码
在线阅读 下载PDF
基于贝叶斯优化的GRU网络轴承剩余使用寿命预测方法 被引量:2
15
作者 孟琳书 张音旋 +1 位作者 张起 王豪 《机电工程》 北大核心 2024年第1期130-136,共7页
传统的滚动轴承剩余使用寿命预测模型存在参数优化的困难。针对这一问题,笔者提出了一种基于贝叶斯优化的GRU网络滚动轴承剩余使用寿命预测方法,并进行了实验验证,即以PHM2012数据集为例,结合贝叶斯优化算法对基于Encoder-Decoder结构... 传统的滚动轴承剩余使用寿命预测模型存在参数优化的困难。针对这一问题,笔者提出了一种基于贝叶斯优化的GRU网络滚动轴承剩余使用寿命预测方法,并进行了实验验证,即以PHM2012数据集为例,结合贝叶斯优化算法对基于Encoder-Decoder结构的门控循环单元(GRU)预测模型的多个超参数进行了优化。首先,对包含噪声的原始数据进行了小波包处理,从滚动轴承的振动机理和故障特征出发提取了时域特征,针对该时域特征进行了优化、筛选,并将其输入到模型中的编码器部分,进一步提取了更深层次的时序特征;其次,结合注意力机制与Encoder-Decoder结构,构造了双向GRU神经网络模型,在模型的高维超参数空间中采用贝叶斯优化方法搜索超参数,得到了最优的超参数组合,并在解码器中融入了线性变换,得到了滚动轴承的寿命预测值;最后,封装了全部模型构建、训练与使用过程,建立了基于贝叶斯优化的GRU网络滚动轴承寿命预测流程,并对方法的有效性进行了对比实验验证。研究结果表明:采用基于贝叶斯优化的GRU网络可以有效预测滚动轴承的剩余使用寿命,相比于其他3种方法的最优结果,基于贝叶斯优化的GRU网络的平均预测得分提高了8.01%;基于贝叶斯优化的GRU网络对于真实寿命较短的轴承预测结果较为准确,而对于真实寿命较长的轴承则没有出现预测值大于真实值的情况,可以作为轴承临近失效阶段剩余使用寿命估计的参考。 展开更多
关键词 参数优化 剩余使用寿命 门控循环单元 贝叶斯优化 超参数调整 注意力机制 Encoder-decoder结构
在线阅读 下载PDF
跨尺度点匹配结合多尺度特征融合的图像配准
16
作者 欧卓林 吕晓琪 谷宇 《液晶与显示》 CAS CSCD 北大核心 2024年第8期1090-1102,共13页
图像配准在脑部疾病的计算机辅助诊疗和远程手术等方面具有重要作用。U-Net及其变体网络广泛应用于医学图像配准领域,在配准精确度和配准时间上取得了较好效果。然而,现有的配准模型在处理复杂图像形变时,难以学习到图像中微小结构的边... 图像配准在脑部疾病的计算机辅助诊疗和远程手术等方面具有重要作用。U-Net及其变体网络广泛应用于医学图像配准领域,在配准精确度和配准时间上取得了较好效果。然而,现有的配准模型在处理复杂图像形变时,难以学习到图像中微小结构的边缘特征,且忽视了不同尺度上下文信息的关联。针对上述问题,本文提出了一种基于跨尺度点匹配结合多尺度特征融合的配准模型。首先,在模型的编码结构中引入跨尺度点匹配模块,增强对图像突出区域特征的表达以及对微小结构边缘细节特征的把握;然后,在解码结构中对多尺度特征进行融合,形成更全面的特征描述;最后,在多尺度特征融合模块中融入注意力模块,突出空间和通道的信息。在3个脑部核磁共振(Magnetic Resonance,MR)数据集上的实验结果表明,以OASIS-3数据集为例,本文方法的配准精确度相较于Affine、SyN、VoxelMorph以及CycleMorph等方法,本文方法分别提升了23.5%、12.4%、0.9%和2.1%;ASD值相较于各方法分别降低了1.074、0.434、0.043和0.076。本文提出的模型能更好地把握图像的特征信息,提升配准的精确度,对医学图像配准的发展具有重要意义。 展开更多
关键词 医学图像配准 编码器-解码器结构 特征加权 特征匹配 注意力机制
在线阅读 下载PDF
融合结构化卷积和双重注意力机制的轻量级眼底图像分割网络 被引量:3
17
作者 汪华登 刘金 +4 位作者 黎兵兵 潘细朋 刘振丙 蓝如师 罗笑南 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第5期760-774,共15页
眼底血管图像的自动分割对于多种眼科疾病的计算机辅助诊断具有重要作用.针对血管的尺度差异和图像噪声导致眼底血管图像分割困难、使用单一尺度卷积运算的深度学习方法获取的特征感受野有限,以及现有的方法复杂度过高的问题,提出一个... 眼底血管图像的自动分割对于多种眼科疾病的计算机辅助诊断具有重要作用.针对血管的尺度差异和图像噪声导致眼底血管图像分割困难、使用单一尺度卷积运算的深度学习方法获取的特征感受野有限,以及现有的方法复杂度过高的问题,提出一个融合结构化卷积和双重注意力机制的轻量级眼底图像分割网络.通过编码器增强、减少下采样次数和特征深度的编码-解码网络设计,实现参数量只有0.63M的轻量化网络.在编码阶段,提出一种结构化卷积方法,有效地避免了网络训练过拟合,提高了网络捕获差异化血管特征的能力;在解码阶段,采用基于空间和通道的双重注意力机制,使网络更加关注血管特征的上下文和几何空间信息,抑制病变等噪声的干扰.在DRIVE,CHASE_DB1和STARE数据集上进行实验的结果表明,所提网络图像分割的准确率分别为96.92%,97.57%和97.51%,灵敏度分别为83.68%,84.99%和84.87%,受试者曲线下的面积(AUC)分别为98.67%,99.05%和99.02%;并通过在DRIVE和STARE数据集上的交叉训练,验证了该网络的泛化能力. 展开更多
关键词 眼底图像分割 编码-解码网络 轻量级网络 结构化卷积 双重注意力机制
在线阅读 下载PDF
SW-SAN:基于Seq2Seq结合注意力机制与滑动窗口的车辆轨迹预测模型 被引量:2
18
作者 朱云鹤 刘明剑 +1 位作者 祝朗千 李沐阳 《现代电子技术》 北大核心 2024年第11期175-180,共6页
针对长时间内4~5 s车辆轨迹预测精度较差的问题,提出基于Seq2Seq结合注意力机制与滑动窗口的车辆轨迹预测模型(SW-SAN)。首先,使用滑动窗口的方法更新历史轨迹状态集合,利用编码器对目标车辆的历史轨迹数据编码,得到历史轨迹特征向量;其... 针对长时间内4~5 s车辆轨迹预测精度较差的问题,提出基于Seq2Seq结合注意力机制与滑动窗口的车辆轨迹预测模型(SW-SAN)。首先,使用滑动窗口的方法更新历史轨迹状态集合,利用编码器对目标车辆的历史轨迹数据编码,得到历史轨迹特征向量;其次,经过注意力机制计算历史时间内各时刻的关联性得分、时间注意力权重因子和历史时间相关性特征向量;最后,解码器将历史时间相关性特征向量作为输入,多次循环解码层,输出目标车辆的未来预测轨迹。实验结果表明,SW-SAN模型在4 s和5 s时预测轨迹的RMSE误差为1.99 m和1.94 m,SW-SAN模型在较长时间4~5 s的预测误差更低,在车辆轨迹预测问题上性能更强。 展开更多
关键词 交通工程 轨迹预测 深度学习 编-解码器结构 注意力机制 滑动窗口
在线阅读 下载PDF
基于无人船的双分支解码轻量型分割网络研究
19
作者 刘丹 张建杰 《激光杂志》 CAS 北大核心 2024年第3期175-181,共7页
为保证水面无人艇(USVs)进行水上任务时能够顺利航行,需要对河道信息进行精确的提取,因此,对河道语义分割的网络模型进行了研究。针对河道图像分割中类间不一致和类内不一致的问题,文中提出了分割网络DBDL-Net,网络中设计双分支解码结... 为保证水面无人艇(USVs)进行水上任务时能够顺利航行,需要对河道信息进行精确的提取,因此,对河道语义分割的网络模型进行了研究。针对河道图像分割中类间不一致和类内不一致的问题,文中提出了分割网络DBDL-Net,网络中设计双分支解码结构和双重损失函数,分别把握语义信息和空间信息;同时在编码部分设计了多尺度残差的轻量模块,一方面减少参数,一方面以不同的比例捕捉特征信息。最后在USVIn-land数据集上对模型进行消融和对比实验,实验结果表明:DBDL-Net的精确度和平均交并比最终达到了93.619%和87.682%,与其他先进分割网络相比,DBDL-Net也具有更佳的综合表现。 展开更多
关键词 水面无人艇 DBDL-Net 双分支解码结构 双重损失函数 多尺度残差的轻量模块
在线阅读 下载PDF
海洋涡旋智能检测研究进展
20
作者 徐广珺 施宇诚 +6 位作者 余洋 谢华荣 谢文鸿 刘婧媛 林夏艳 刘宇 董昌明 《海洋学研究》 CSCD 北大核心 2024年第3期38-50,共13页
海洋涡旋是一种常见的海洋现象,在全球海洋物质和能量的输运中起着重要作用。随着海洋研究技术手段的不断提升,各类海洋涡旋检测方法应运而生。传统涡旋检测方法应用广泛,但其过度依赖于专家经验设置阈值和持续的人工干预,存在检测误差... 海洋涡旋是一种常见的海洋现象,在全球海洋物质和能量的输运中起着重要作用。随着海洋研究技术手段的不断提升,各类海洋涡旋检测方法应运而生。传统涡旋检测方法应用广泛,但其过度依赖于专家经验设置阈值和持续的人工干预,存在检测误差较大、工作效率低以及全球普适性差等问题,难以适应复杂多变的海洋环境。当前人工智能快速发展,其在海洋涡旋智能检测中能够自动、快速地提取图像深层特征,有效解决海洋现象特征相似度高、几何差异大的问题。该文立足于当前海洋涡旋智能检测的发展现状,从编码器-解码器结构、全卷积神经网络、多尺度上下文方法和注意力机制等方面回顾了不同深度学习方法在海洋涡旋智能检测中的应用,以期为海洋涡旋研究提供一些启示和参考。 展开更多
关键词 海洋涡旋 人工智能 特征检测 深度学习 编码器-解码器结构 全卷积神经网络 多尺度上下文方法 注意力机制
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部