期刊文献+
共找到165篇文章
< 1 2 9 >
每页显示 20 50 100
融合混合空洞卷积和动态卷积的敦煌壁画修复
1
作者 刘仲民 李耀龙 胡文瑾 《计算机工程与设计》 北大核心 2025年第2期595-602,共8页
为有效修复壁画破损区域的语义信息、解决壁画深层特征信息提取不足导致的修复伪影以及修复失真等问题,提出一种融合混合空洞卷积与动态卷积的敦煌壁画修复模型。针对修复伪影问题,在模型编码阶段设计一种混合残差模块;针对修复失真问题... 为有效修复壁画破损区域的语义信息、解决壁画深层特征信息提取不足导致的修复伪影以及修复失真等问题,提出一种融合混合空洞卷积与动态卷积的敦煌壁画修复模型。针对修复伪影问题,在模型编码阶段设计一种混合残差模块;针对修复失真问题,通过在动态核预测分支和动态语义及图像滤波分支中加入动态卷积来提高网络的预测和滤波性能。实验结果表明,所提模型具有更高的评价指标,且视觉效果上具有更细致的纹理,语义信息更丰富,边缘结构更连贯。 展开更多
关键词 信息处理技术 壁画修复 混合空洞卷积 动态卷积 图像滤波 残差网络 深度学习
在线阅读 下载PDF
基于多尺度动态卷积和GRU的轴承故障诊断
2
作者 董绍江 彭银山 +1 位作者 邹松 黄翔 《组合机床与自动化加工技术》 北大核心 2025年第3期150-154,共5页
针对传统轴承故障诊断过程中忽略轴承振动信号的关联时间维度信息的问题,提出了基于多尺度动态扩张卷积神经网络(MSDDCNN)和门控循环单元网络(GRU)的轴承故障诊断方法。首先利用不同尺寸宽卷积核从各个维度捕捉振动信号多维特征以增大... 针对传统轴承故障诊断过程中忽略轴承振动信号的关联时间维度信息的问题,提出了基于多尺度动态扩张卷积神经网络(MSDDCNN)和门控循环单元网络(GRU)的轴承故障诊断方法。首先利用不同尺寸宽卷积核从各个维度捕捉振动信号多维特征以增大感受野;其次引入动态加权层自适应选择卷积核尺度的大小并自动地给予特征序列中的不同部分不同的权重,更加充分提升特征表示的能力;最后利用门控循环单元充分提取振动信号中不同尺度的时序特征,以加强各个维度间前后时间维度关联信息。实验结果表明,所提方法在PU和JNU公开数据集上平均准确率分别为98.79%和98.65%。为验证所提网络模型诊断有效性,所提方法在某公司自制的轴承故障数据集(CME)也表现出较高的准确率和较大抗噪声能力,为有效诊断旋转部件故障提供了实际依据。 展开更多
关键词 多尺度 动态卷积 扩张卷积 GRU 故障诊断
在线阅读 下载PDF
融合道路特征的动态卷积遥感影像道路提取网络模型 被引量:2
3
作者 陈涛 葛小三 《地理与地理信息科学》 北大核心 2025年第2期23-30,共8页
受道路特性和卷积池化等操作影响,现有遥感影像道路提取方法仍存在空间特征和地物细节信息丢失问题,造成提取错漏。该文基于遥感影像中道路狭长特点设计了一种语义分割网络模型OSPNet,基于条状注意力机制使模型更专注于道路信息,减少错... 受道路特性和卷积池化等操作影响,现有遥感影像道路提取方法仍存在空间特征和地物细节信息丢失问题,造成提取错漏。该文基于遥感影像中道路狭长特点设计了一种语义分割网络模型OSPNet,基于条状注意力机制使模型更专注于道路信息,减少错提取;同时,使用动态卷积构造模型的编码器,从而增强模型对不同类型道路提取的泛化能力和对不同场景的适应性;在模型训练过程中,采用骰子损失函数和焦点损失的混合损失函数解决遥感影像中道路类别与背景类别不均衡的问题。在Massachusetts和CHN6-CUG道路数据集上的验证结果表明,与DeepLabV3+相比,该模型的F 1分数、交并比和平均交并比分别提升1.37%、1.78%和1.03%,相较其他网络评价指标结果最佳,提取的道路连续性、完整性好,且训练时间远低于其他模型,是一种适应性更强、分割精度更高、更轻量化的道路提取算法。 展开更多
关键词 道路提取 动态卷积 条状注意力机制
在线阅读 下载PDF
融合动态卷积和注意力机制的多层感知机语音情感识别 被引量:1
4
作者 张雨萌 张欣 +1 位作者 高谋 赵虎林 《计算机科学与探索》 北大核心 2025年第4期1065-1075,共11页
语音情感识别技术通过分析语音信号推断说话者情绪,增强人机交互的自然性和智能性。然而,现有模型往往忽视时频语义信息,影响识别准确性。为此,提出了一种融合动态卷积与注意力机制的多层感知机模型,显著提高了情感识别的准确度及信息... 语音情感识别技术通过分析语音信号推断说话者情绪,增强人机交互的自然性和智能性。然而,现有模型往往忽视时频语义信息,影响识别准确性。为此,提出了一种融合动态卷积与注意力机制的多层感知机模型,显著提高了情感识别的准确度及信息利用效率。将输入的语音信号转化为梅尔频谱图,捕捉信号细节变化,更贴切地反映人类对声音的感知,为后续特征提取奠定了基础。通过词元化处理将梅尔频谱图转化为词元,降低了数据的复杂性。借助动态卷积与分离注意力机制高效提取关键的时频特征。一方面,动态卷积能够适应不同时间和频率上的尺度变化,优化了特征捕捉效率;另一方面,分离注意力机制增强了模型对关键信息的聚焦能力,有效提升了模型对特征的表达能力。结合动态卷积与分离注意力机制的优势,该模型能够更加充分地提取关键声学特征,从而实现了更高效、更精准的情感识别。在RAVDESS、EmoDB和CASIA三个语音情感数据库上的测试显示,模型识别准确率显著优于现有技术,达到86.11%、95.33%和82.92%。这验证了模型在复杂情感识别任务的高效性和准确性,以及动态卷积和注意力机制的有效性。 展开更多
关键词 语音情感识别 梅尔频谱图 多层感知机 动态卷积 注意力机制
在线阅读 下载PDF
一种基于时序注意力动态卷积的油气井产量预测方法
5
作者 杨晨 彭小龙 +3 位作者 朱苏阳 王超文 官文洁 向东流 《油气藏评价与开发》 北大核心 2025年第6期1046-1055,共10页
目前机器学习对油气井产量预测效果不佳的原因在于常规方法过度依赖历史产量数据特征,使得预测结果更多地表现为对历史信息的重组,而难以预测新的趋势。这些方法忽略了其他重要的时序变量,如油气井的开发阶段、压力和产水等对产量的影... 目前机器学习对油气井产量预测效果不佳的原因在于常规方法过度依赖历史产量数据特征,使得预测结果更多地表现为对历史信息的重组,而难以预测新的趋势。这些方法忽略了其他重要的时序变量,如油气井的开发阶段、压力和产水等对产量的影响。为了解决这些问题,研究提出了压力、产水和产量的关联对策,并建立了一种基于时序注意力动态卷积神经网络的油气井产量预测方法,该方法以时域卷积神经网络为基础模型,引入了多头注意力和动态卷积机制,从而捕捉输入特征序列中不同时间步之间的长期依赖关系,并为每个时间步分配不同的权重。动态卷积模块可以根据时序注意力模块的输出,动态地生成卷积核参数,从而适应不同生产阶段的输入特征。通过安岳采气作业区多井真实复杂案例的验证,展示了基于时序注意力动态卷积的油气井产量预测模型的优越性。研究表明,所提出的模型在面对随机选取的4口井时表现出更好的预测效果。进一步通过对注意力权重和动态卷积权重的可视化分析,发现该模型能够根据不同开发阶段动态调整卷积核权重,特别是针对气井的初始阶段、过渡阶段和衰退阶段。通过结合开发阶段的压力、产水和产量关系,时序注意力动态卷积神经网络模型能自适应调整其结构和参数,从而实现对油气井产量的精准预测。 展开更多
关键词 油气井产量预测 时域卷积神经网络 多头注意力 动态卷积 自适应
在线阅读 下载PDF
基于多路径动态卷积的YOLOv5无人机航拍目标检测模型
6
作者 宋苏 汪方正 +1 位作者 高建安 刘泓森 《现代电子技术》 北大核心 2025年第7期72-78,共7页
为了提升无人机航拍影像目标检测的准确率,并实现模型的轻量化,文中对YOLOv5目标检测模型进行了多方面的改进。首先,对YOLOv5的骨干网络进行了优化重组,采用更高效的动态卷积结构和多通道并行处理策略增强特征提取能力和检测精度,并显... 为了提升无人机航拍影像目标检测的准确率,并实现模型的轻量化,文中对YOLOv5目标检测模型进行了多方面的改进。首先,对YOLOv5的骨干网络进行了优化重组,采用更高效的动态卷积结构和多通道并行处理策略增强特征提取能力和检测精度,并显著减少模型参数量;其次,改进了损失函数,引入Focal⁃EIoU损失函数,更适合无人机航拍图像的特点,进一步提升了模型的检测精度;此外,将原本耦合的检测头进行了解耦处理,设计了轻量级解耦头,使分类、回归和置信度任务解耦处理,提高了检测精度和收敛速度,并合理控制了模型参数量。实验结果表明,改进后的DEP⁃YOLO模型在mAP@0.5指标上提升了9.6%,同时模型大小和参数量分别降低了77.93%和83.82%。综上所述,文中提出的综合改进策略显著提升了无人机航拍影像目标检测的精度,并实现了模型的轻量化,验证了其在航拍影像目标检测领域的有效性。 展开更多
关键词 目标检测 无人机航拍 YOLOv5 模型轻量化 动态卷积 解耦检测头 Focal⁃EIoU损失函数 特征提取
在线阅读 下载PDF
变工况下动态卷积域对抗图神经网络故障诊断 被引量:1
7
作者 王桐 王晨程 +2 位作者 邰宇 欧阳敏 陈立伟 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2024年第7期1406-1414,共9页
针对基于无监督域自适应故障诊断方法忽略了域间数据结构信息、传统域对齐平均最大差异法全局泛化能力差等问题,本文提出一种基于无监督域自适应理论的动态卷积域对抗图神经网络故障诊断模型,分别通过对数据的类别标签、域标签和数据结... 针对基于无监督域自适应故障诊断方法忽略了域间数据结构信息、传统域对齐平均最大差异法全局泛化能力差等问题,本文提出一种基于无监督域自适应理论的动态卷积域对抗图神经网络故障诊断模型,分别通过对数据的类别标签、域标签和数据结构信息进行建模。通过分类器和域鉴别器分别建模类别标签和域标签,通过图神经网络将数据结构信息嵌入到实例图节点中,利用高斯Wasserstein距离来度量不同领域的实例图之间的差异。本文对比了不同工况下共14种迁移任务在各模型下故障识别的准确率。实验结果表明:基于动态卷积的域对抗图神经网络模型在变工况下的故障诊断效果均优于其他对比模型,且模型性能稳定。 展开更多
关键词 无监督域自适应 动态卷积 域对抗 图神经网络 图生成 高斯Wasserstein距离 故障诊断 变工况
在线阅读 下载PDF
基于可迁移注意力和动态卷积的滚动轴承跨工况故障诊断方法 被引量:1
8
作者 王煜伟 朱静 +1 位作者 史曜炜 邓艾东 《轴承》 北大核心 2024年第2期82-88,共7页
为克服跨工况场景中数据分布差异导致的传统深度学习模型泛化性能降低问题,基于领域自适应理论提出了一种结合可迁移注意力和动态卷积的滚动轴承跨工况故障诊断方法(TADAN)。TADAN的核心思想是在学习丰富互补的多尺度特征基础上量化不... 为克服跨工况场景中数据分布差异导致的传统深度学习模型泛化性能降低问题,基于领域自适应理论提出了一种结合可迁移注意力和动态卷积的滚动轴承跨工况故障诊断方法(TADAN)。TADAN的核心思想是在学习丰富互补的多尺度特征基础上量化不同尺度特征的可迁移性并对其进行差异性强化和融合,以提高所学特征表示的可迁移性和模型的适用性,从而学习到富含判别故障信息的领域不变的诊断知识,在无监督目标域中实现高性能诊断。公开轴承数据集上大量诊断任务的试验结果表明,基于动态卷积的多尺度特征提取器可以提取更丰富的特征并提高模型的自适应能力,可迁移计算模块可促进领域不变特征的学习并降低负迁移风险,TADAN比SCNN,MCNN,DAN等方法的故障诊断准确率更高。 展开更多
关键词 滚动轴承 故障诊断 迁移学习 特征提取 动态卷积 变工况 注意力机制
在线阅读 下载PDF
基于像素距离图和四维动态卷积网络的密集人群计数与定位方法
9
作者 高阳峄 雷涛 +3 位作者 杜晓刚 李岁永 王营博 闵重丹 《计算机应用》 CSCD 北大核心 2024年第7期2233-2242,共10页
基于卷积神经网络(CNN)获得回归密度图的方法已成为人群计数与定位的主流方法,但现有方法仍存在两个问题:首先传统方法获得的密度图在人群密集区域存在粘连和重叠问题,导致网络最终人群计数和定位错误;其次,常规卷积由于其权重不变,无... 基于卷积神经网络(CNN)获得回归密度图的方法已成为人群计数与定位的主流方法,但现有方法仍存在两个问题:首先传统方法获得的密度图在人群密集区域存在粘连和重叠问题,导致网络最终人群计数和定位错误;其次,常规卷积由于其权重不变,无法实现对图像特征的自适应提取,难以处理复杂背景和人群密度分布不均匀的图像。为解决上述问题,提出一种基于像素距离图(PDMap)和四维动态卷积网络(FDDCNet)的密集人群计数与定位方法。首先定义了一种新的PDMap,利用像素级标注点之间的空间距离关系,通过取反操作提高人头中心点周围像素的平滑度,避免人群密集区域的粘连重叠;其次,设计了一种FDDC模块,自适应地改变卷积四个维度的权重,提取不同视图提供的先验知识,应对复杂场景和分布不均匀导致的计数与定位困难,提高网络模型的泛化能力和鲁棒性;最后,采用阈值过滤局部不确定预测值,进一步提高计数与定位的准确性。在NWPU-Crowd数据集的测试集上:在人群计数方面,所提方法的平均绝对误差(MAE)和均方误差(MSE)分别为82.4和334.7,比MFP-Net(Multi-scale Feature Pyramid Network)分别降低了8.7%和26.9%;在人群定位方面,所提方法的综合评价指标F1值和精确率分别为71.2%和73.6%,比TopoCount(Topological Count)方法分别提升了3.0%和5.9%。实验结果表明,所提方法能够处理复杂背景的密集人群图像,取得了更高的计数准确率和定位精准度。 展开更多
关键词 卷积神经网络 人群计数 人群定位 距离变化 动态卷积 局部极大值检测
在线阅读 下载PDF
基于全维动态卷积的无人机航拍图像轻量化目标检测 被引量:4
10
作者 魏仁干 丰霜 孔华锋 《计算机应用与软件》 北大核心 2024年第5期158-165,182,共9页
针对传统无人机航拍图像目标检测中出现的模型体积大、检测准确率低等问题,提出一种轻量化的无人机航拍图像目标检测算法。以YOLOv5s为基础,增加小目标检测层,采用全维动态卷积替换普通卷积,减少了参数量。使用跨层跨尺度的加权特征融合... 针对传统无人机航拍图像目标检测中出现的模型体积大、检测准确率低等问题,提出一种轻量化的无人机航拍图像目标检测算法。以YOLOv5s为基础,增加小目标检测层,采用全维动态卷积替换普通卷积,减少了参数量。使用跨层跨尺度的加权特征融合,并引入FasterNet模块,加强特征提取能力。使用动态标签分配策略,显著提升检测精度。实验结果表明,提出的算法在准确率和模型体积方面优于原YOLOv5s算法,可以更高效地完成无人机航拍图像的目标检测任务。 展开更多
关键词 航拍图像 目标检测 动态卷积 特征融合 标签分配
在线阅读 下载PDF
基于全维动态卷积的交通标志识别 被引量:2
11
作者 李文举 于杰 +2 位作者 沙利业 崔柳 杨红喆 《计算机工程与应用》 CSCD 北大核心 2024年第18期316-323,共8页
针对现有交通标志识别算法对于小目标和遮挡目标的识别精度不高,且识别速度较慢的问题,通过改进YOLOv5网络,设计一种基于全维动态卷积(ODConv)的交通标志识别算法。将主干网络中的部分卷积替换为全维动态卷积,以便在特征提取过程中获取... 针对现有交通标志识别算法对于小目标和遮挡目标的识别精度不高,且识别速度较慢的问题,通过改进YOLOv5网络,设计一种基于全维动态卷积(ODConv)的交通标志识别算法。将主干网络中的部分卷积替换为全维动态卷积,以便在特征提取过程中获取更丰富的信息,提高网络对小目标的敏感度;为了减少上采样过程中信息的丢失,在特征融合网络中使用亚像素卷积模块替换原有的最近邻插值上采样模块,并使用高效层聚合模块替换原有的跨阶段层次模块,提高特征融合效率,延长梯度最短路径,改善小目标检测效果;使用SIoU函数计算回归损失,解决真实框与预测框之间方向不匹配的问题,进一步提高对道路交通标志的检测精度。在TT100K数据集上测试本模型,平均精度(mAP@0.5)达到了93.85%,召回率(Recall)达到了90.73%,与基准网络YOLOv5n相比分别提高了3.90%和5.69%,帧处理速度达到89.29。 展开更多
关键词 交通标志识别 YOLOv5 全维动态卷积 亚像素卷积模块 高效层聚合模块
在线阅读 下载PDF
基于全局图推理与改进三维动态卷积的鱼类摄食行为分析
12
作者 丁寅 陈明 +1 位作者 栗征 薛江浩 《江苏农业学报》 CSCD 北大核心 2024年第10期1863-1874,共12页
本研究提出一种基于时间动作检测的轻量化视频分类网络,旨在解决水产智能化养殖中饵料的投喂不均和水体污染等问题,提高投喂准确性和效率。该网络以ResNet 3D为基础,引入深度可分离卷积模块和三维动态卷积模块,以降低模型规模和参数量;... 本研究提出一种基于时间动作检测的轻量化视频分类网络,旨在解决水产智能化养殖中饵料的投喂不均和水体污染等问题,提高投喂准确性和效率。该网络以ResNet 3D为基础,引入深度可分离卷积模块和三维动态卷积模块,以降低模型规模和参数量;同时采用图卷积全局推理模块和稠密卷积模块构建区域和全局关系,增强网络深层特征的表达,提高网络分类准确率。经试验验证,该模型检测准确率可达96.70%,相较变分自动编码器卷积网络和3D ResNet-GloRe网络,其准确率分别提高7.7个百分点和4.4个百分点;同时,该模型的参数量和计算量也明显降低,分别为1.10 M和3.87 G。研究结果表明,该基于时间动作检测的轻量化视频分类网络可以有效提高水产养殖中饵料的智能化投喂的准确性和效率,减少饵料投喂不均以及水体污染等问题,具有较高的应用价值。 展开更多
关键词 鱼类行为 机器视觉 视频分类 全局图推理 动态卷积
在线阅读 下载PDF
用于文本情感极性分析的动态卷积神经网络超限学习算法 被引量:7
13
作者 贾熹滨 李宁 靳亚 《北京工业大学学报》 CAS CSCD 北大核心 2017年第1期28-35,共8页
为改善动态卷积神经网络在文本情感分类方法中的泛化能力,提出了一种动态卷积超限学习算法.对动态卷积神经网络的输出层加以改进,使用浅层随机神经网络替代全连接层,利用参数随机生成的扰动性能,降低分类端对训练样本的依赖,避免过拟合... 为改善动态卷积神经网络在文本情感分类方法中的泛化能力,提出了一种动态卷积超限学习算法.对动态卷积神经网络的输出层加以改进,使用浅层随机神经网络替代全连接层,利用参数随机生成的扰动性能,降低分类端对训练样本的依赖,避免过拟合,提升分类性能.在公共数据集上的实验证明:相对改进前的动态卷积学习算法以及超限学习机,所提出的方法在准确率、F1测度等多个标准指标上均体现了更优的分类性能. 展开更多
关键词 文本情感分类 动态卷积 超限学习机 动态卷积超限学习算法
在线阅读 下载PDF
融合注意力特征及动态卷积的肺结节辅助诊断 被引量:6
14
作者 谷宇 刘佳琪 +3 位作者 杨立东 张宝华 张祥松 贾成一 《科学技术与工程》 北大核心 2023年第16期6834-6844,共11页
针对肺结节关键影像征象信息不易获取,部分卷积神经网络(convolutional neural networks,CNN)模型对肺结节的识别率不高的问题,提出一种融合注意力特征的动态卷积残差网络(dynamic convolutional residual networks incorporating atten... 针对肺结节关键影像征象信息不易获取,部分卷积神经网络(convolutional neural networks,CNN)模型对肺结节的识别率不高的问题,提出一种融合注意力特征的动态卷积残差网络(dynamic convolutional residual networks incorporating attention features,DcANet),并在有效实现肺结节良恶性分类的基础上对所提模型的诊断结果进行可视化分析。此网络以适应肺结节三维小尺寸输入特点的残差网络为基本框架,在DcABlock部分使用可以自适应调整卷积参数的动态卷积以及迭代注意特征融合模块,使模型能够更准确地获取肺结节信息,提高模型的表征能力。此外,还使用类激活映射将三维图像的各层切片进行可视化分析。实验在最终测试集上的准确率为85.87%,平衡F分数(F1)值为82.67%,敏感度和特异性的综合指标Gmean值为85.51%。实验结果表明:该网络可以提升对肺结节良恶性分类的准确性,诊断结果具有可信性,有一定的临床应用价值。 展开更多
关键词 肺结节辅助诊断 动态卷积 迭代注意特征融合模块 深度学习 类激活映射
在线阅读 下载PDF
基于动态卷积多层域自适应的轴承故障诊断 被引量:6
15
作者 周华锋 程培源 +2 位作者 邵思羽 赵玉伟 焦晓璇 《计算机应用研究》 CSCD 北大核心 2022年第7期2098-2103,共6页
现有基于深度学习的轴承故障诊断方法对数据具有一定的依赖性,要求训练数据与测试数据具有相同的分布。在变工况的条件下,网络模型的故障诊断精度会因数据分布发生变化而下降。为保证网络模型能够在变工况条件下对轴承的健康状态进行准... 现有基于深度学习的轴承故障诊断方法对数据具有一定的依赖性,要求训练数据与测试数据具有相同的分布。在变工况的条件下,网络模型的故障诊断精度会因数据分布发生变化而下降。为保证网络模型能够在变工况条件下对轴承的健康状态进行准确识别,基于无监督域自适应理论,提出一种新颖的智能故障诊断网络模型——动态卷积多层域自适应网络。该网络一方面充分利用动态卷积强有力的特征提取能力,提取更多有效的故障特征;另一方面采用相关对齐实施非线性变换,同时对齐多层故障特征分布的二阶统计量,促进源域的诊断知识向目标域迁移,提高了模型在目标域无故障标签条件下的故障识别准确率。最后,在两个数据集共14个迁移任务下进行实验,实验结果表明,动态卷积多层域自适应网络能够实现较高的故障诊断识别精度。 展开更多
关键词 轴承 智能故障诊断 无监督域自适应 动态卷积
在线阅读 下载PDF
基于动态卷积与残差门控的多模态情感识别 被引量:2
16
作者 郭艳霞 金勇 +1 位作者 唐宏 彭金枝 《计算机工程》 CAS CSCD 北大核心 2023年第7期94-101,共8页
为了防止一段话语中含有情感色彩的重要信息被无关信息淹没并实现多模态信息交互,通过挖掘高级局部特征以及设计有效的交互融合策略,提出一种基于动态卷积与残差门控的多模态情感识别模型。提取文本、音频和图像中的低级特征、高级局部... 为了防止一段话语中含有情感色彩的重要信息被无关信息淹没并实现多模态信息交互,通过挖掘高级局部特征以及设计有效的交互融合策略,提出一种基于动态卷积与残差门控的多模态情感识别模型。提取文本、音频和图像中的低级特征、高级局部特征以及上下文依赖关系,同时使用跨模态动态卷积对模态间和模态内交互信息进行建模,模拟长序列时域间的相互作用,捕捉不同模态的交互特征。设计一种残差门控融合方法来融合不同模态交互表征,自动学习每组交互表征对最终情感识别的影响权重,并将多模态融合特征输入分类器进行情感预测。在CMU-MOSEI和IEMOCAP数据集上的实验结果表明,该模型能够避免多模态中含有情感色彩的重要信息被无关信息淹没,情感分类准确率分别达到83.5%和83.9%,性能优于MulT、MFRM等基准模型。 展开更多
关键词 自然语言处理 信息交互 多模态情感识别 动态卷积 门控机制
在线阅读 下载PDF
基于动态卷积的胸部X光片疾病分类算法 被引量:2
17
作者 李锵 赵启蒙 关欣 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2022年第9期953-964,共12页
胸部疾病严重威胁人类健康,及时并精准地检测胸部疾病对患者的治疗与康复具有重要意义.胸部疾病经常通过胸部X光片进行诊断,但由于胸部疾病的多样性以及病理特征的复杂性,现有的胸部X光片疾病分类算法存在分类准确度较低、模型复杂度较... 胸部疾病严重威胁人类健康,及时并精准地检测胸部疾病对患者的治疗与康复具有重要意义.胸部疾病经常通过胸部X光片进行诊断,但由于胸部疾病的多样性以及病理特征的复杂性,现有的胸部X光片疾病分类算法存在分类准确度较低、模型复杂度较高等问题.针对以上问题,提出一种基于动态卷积的胸部X光片疾病分类算法.将动态卷积模块加入密集连接网络,在不显著增加网络模型尺寸的前提下,增强网络对多尺度信息的特征提取能力,在提升分类准确度的同时保持高效推理;使用Meta-ACON改进ReLU(rectified linear units)激活函数,通过线性-非线性切换因子自适应地选择是否激活以及使用何种激活函数,从而增强网络的泛化能力;提出加权焦点损失函数,在焦点损失函数的基础上加入权重调整因子,使网络依据分类的难易程度为每种疾病合理分配权重,增大较难分类疾病的损失占比以提高其分类准确度,进而优化整体性能;对数据加载方式进行优化,增大批数据处理量以提升批归一化效果;在测试阶段使用测试时数据增强策略,综合分析多个维度的分类结果,提高分类的准确性与鲁棒性.在chest X-ray14数据集上的实验结果表明,在密集连接网络中加入动态卷积模块、Meta-ACON激活函数、加权焦点损失函数并在实验时优化数据加载方式、使用测试时数据增强策略的算法对14种胸部疾病分类的平均受试者工作特征曲线下面积(area under receiver operating characteristic curve,AUC)值达到0.8361,针对单个疾病标签的AUC值最高可达0.9534,高于目前6种先进算法.实验结果表明,基于动态卷积的胸部X光片疾病分类算法具有分类准确度高、模型鲁棒性强等优势,可良好地适用于胸部X光片疾病分类任务. 展开更多
关键词 胸部X光片 疾病分类 密集连接网络 动态卷积 ACON激活函数 加权焦点损失函数
在线阅读 下载PDF
基于动态卷积与注意力的多特征融合行人重识别 被引量:3
18
作者 耿韶松 李晋国 《计算机工程与设计》 北大核心 2023年第4期1228-1234,共7页
为能够准确利用图像中有效特征,提取判别性较高的信息区分特征相近的行人,提出一种基于动态卷积和注意力机制的多分支网络。将动态卷积核作用于ResNet50网络中,使动态卷积中的注意力机制与网络中的通道和空间注意力共同作用,通过不同分... 为能够准确利用图像中有效特征,提取判别性较高的信息区分特征相近的行人,提出一种基于动态卷积和注意力机制的多分支网络。将动态卷积核作用于ResNet50网络中,使动态卷积中的注意力机制与网络中的通道和空间注意力共同作用,通过不同分支得到相应局部特征,融合得到高判别性特征进行分类匹配。在CUHK03、DuckMTMC-reID、Market-1501数据集上进行验证实验,其结果表明了所提模型的优越性。 展开更多
关键词 行人重识别 动态卷积 通道注意力机制 空间注意力机制 多特征融合 难样本三元组损失 多分支网络
在线阅读 下载PDF
动态卷积生成对抗网络的视频帧预测方法研究 被引量:2
19
作者 安利智 何平 +2 位作者 张薇 石钰阳 田宇 《小型微型计算机系统》 CSCD 北大核心 2022年第2期278-284,共7页
针对当前视频帧预测模型中存在的预测准确度较差和物体结构信息丢失等问题,提出了一种动态卷积生成对抗网络.在生成网络中,首先使用卷积长短时记忆网络初步提取输入视频流的图像特征,然后利用卷积神经动态平流单元对视频流中的运动特征... 针对当前视频帧预测模型中存在的预测准确度较差和物体结构信息丢失等问题,提出了一种动态卷积生成对抗网络.在生成网络中,首先使用卷积长短时记忆网络初步提取输入视频流的图像特征,然后利用卷积神经动态平流单元对视频流中的运动特征进行提取,最后将上述两种特征组合后输出一组预测视频帧;在判别网络中,采用一个3D卷积网络一次性接收全部视频帧.在实验中,使用Adam方法优化模型的参数,采用KTH和BAIR Robot Pushing数据集作为训练数据集.实验结果表明:无论是在长时间视频帧预测准确度和物体结构信息保留方面,还是人眼的主观感受上,动态卷积生成对抗网络均优于变分生成对抗网络,其在结构相似性度量指标下提高了14.5%,在学习感知图像块相似性指标下提高了7.69%,并且生成的预测视频更加流畅,具有更高的实用价值. 展开更多
关键词 视频帧预测 卷积动态神经平流单元 生成对抗网络 变分生成对抗网络
在线阅读 下载PDF
基于动态蛇形卷积的钢轨RGB图像光带分割方法
20
作者 程雨 刘金朝 +5 位作者 姜昕良 张长伦 张国粹 顾子晨 王乐 宋浩然 《中国铁道科学》 北大核心 2025年第2期37-48,共12页
针对钢轨光带边缘存在的锯齿状现象导致对灰度图像进行光带分割算法精度不高的问题,提出基于动态蛇形卷积的钢轨RGB图像光带分割方法。设计和实现基于彩色线阵相机与白激光光源的RGB图像采集模块,通过嵌入动态蛇形卷积加强锯齿状不规则... 针对钢轨光带边缘存在的锯齿状现象导致对灰度图像进行光带分割算法精度不高的问题,提出基于动态蛇形卷积的钢轨RGB图像光带分割方法。设计和实现基于彩色线阵相机与白激光光源的RGB图像采集模块,通过嵌入动态蛇形卷积加强锯齿状不规则特征的提取,改进DeepLabv3+分割网络,完成基于RGB图像光带与轨面的一体化分割,实现对光带的分类检测。结果表明:对非道岔区段RGB图像分割的平均交并比为93.50%,类别平均像素准确率为96.39%,像素准确率为98.85%;包含道岔区段RGB图像分割的平均交并比、类别平均像素准确率以及像素准确率分别为91.87%,96.04%和98.60%;RGB图像可较好地还原钢轨表面的真实状态,加入动态蛇形卷积改进的分割网络能够实现对钢轨光带区域的精确提取,比现有方法的平均交并比提升了2.25%。 展开更多
关键词 钢轨 光带分割 检测 RGB图像 动态蛇形卷积
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部