期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于语义增强和特征融合的文本生成图像方法
1
作者 吴昊文 王鹏 +3 位作者 李亮亮 邸若海 李晓艳 吕志刚 《计算机工程与应用》 北大核心 2025年第15期229-240,共12页
文本生成图像是机器学习领域中非常具有挑战性的任务,虽然目前已有很大的突破,但仍然存在图像细粒度不够和语义一致性弱的问题,因此提出了一种基于语义增强和特征融合的文本生成图像方法(SEF-GAN)。针对初始特征表征不足问题,提出了空... 文本生成图像是机器学习领域中非常具有挑战性的任务,虽然目前已有很大的突破,但仍然存在图像细粒度不够和语义一致性弱的问题,因此提出了一种基于语义增强和特征融合的文本生成图像方法(SEF-GAN)。针对初始特征表征不足问题,提出了空间交叉重建模块,对不同信息量特征图进行分离与交叉重建,获得更精细化特征。为了提高文本属性信息的有效利用表征,设计了语义关联注意力模块,提高了文本描述和视觉内容之间的语义一致性。为了充分利用图像区域特征与文本语义标签之间的隐藏联系,构建了通道特征融合模块,将区域图像特征与文本隐层特征进行仿射,对目标区域重构并保留图像中与文本无关内容,并连接反残差结构进一步增强特征表达能力。在CUB和COCO数据集上实验结果表明,相对于现有先进方法,该方法将IS指标分别提高了18.8%和6.3%,FID指标分别提高了33.9%和14.6%,RP指标分别提高了10.9%和3.3%。证实所提方法能有效生成细节更丰富的图像,与文本描述更加吻合。 展开更多
关键词 文本生成图像 生成对抗网络 属性特征学习 图像语义融合 反残差结构
在线阅读 下载PDF
引入级联通道注意力的轻量化人体姿态估计 被引量:3
2
作者 林远强 郜辉 +3 位作者 王鹏 吕志刚 李晓艳 王储 《计算机工程与应用》 CSCD 北大核心 2024年第13期219-227,共9页
针对当前人体姿态估计模型在轻量化过程中精度损失严重的问题,以高分辨率网络(HRNet)为基线提出一种引入级联通道注意力的轻量化人体姿态估计模型。构建一种保持内部高分辨率特征的级联通道注意力,学习输入特征各通道的重要性来提高模... 针对当前人体姿态估计模型在轻量化过程中精度损失严重的问题,以高分辨率网络(HRNet)为基线提出一种引入级联通道注意力的轻量化人体姿态估计模型。构建一种保持内部高分辨率特征的级联通道注意力,学习输入特征各通道的重要性来提高模型表征能力;通过设计一种基于MetaFormer结构的轻量级深度卷积变换模块来替换HRNet阶段2、3、4中运算复杂度较高的残差模块;设计一种多尺度特征融合方法减少HRNet原融合方法中的多维特征语义信息损失;采用无偏数据处理来消除关键点热力图编码过程中导致的偏移误差。COCO2017验证集的实验结果表明,所提出的模型同基准模型相比,在AP降低2个百分点的情况下,模型参数量和浮点运算量分别减少了90.2%和83.1%,并且以AP为71.4%的表现在轻量化模型中达到精度最优。 展开更多
关键词 人体姿态估计 轻量化 通道注意力 MetaFormer结构 多尺度特征融合
在线阅读 下载PDF
采用动态样本分配的特征融合目标检测算法 被引量:1
3
作者 牛文涛 王鹏 +3 位作者 陈遵田 李晓艳 郜辉 孙梦宇 《计算机工程与应用》 CSCD 北大核心 2024年第15期211-220,共10页
针对轻量级目标检测算法SSD-Lite检测精度低、对小目标预测能力差等问题,提出了一种采用动态样本分配策略的多尺度特征融合目标检测算法。在轻量级目标检测算法SSD-Lite的颈部网络引入特征金字塔结构(feature pyramid network,FPN),并... 针对轻量级目标检测算法SSD-Lite检测精度低、对小目标预测能力差等问题,提出了一种采用动态样本分配策略的多尺度特征融合目标检测算法。在轻量级目标检测算法SSD-Lite的颈部网络引入特征金字塔结构(feature pyramid network,FPN),并对其进行轻量化设计,同时引入残差特征增强模块(residual feature augmentation,RFA),采用残差分支注入不同空间的上下文信息来改善高层特征的特征表达,以提升网络对小目标的检测能力;在特征金字塔结构中插入轻量级注意力机制ECA模块,提升网络对重要特征的关注能力;针对网络训练过程中采用的固定交并比(intersection-over-union,IOU)阈值的样本分配策略导致的正负样本分配适应性差、难以选出高质量正样本等问题,设计了一种动态样本分配策略,取消锚框的预设置,采用中心点采样的方式,同时结合样本均值、标准差作为筛选阈值,减少人工先验的影响,在不改变网络结构的情况下提升算法性能。算法在Pascal VOC数据集上测试,实验结果表明:该算法整体预测精度相较于基准算法提升1.9个百分点,对小目标检测能力提升3.3个百分点,算法推理时延仅增加2.32%;实验证明了该算法可以以较小的性能代价,显著提升算法的预测精度。 展开更多
关键词 特征金字塔结构 残差特征增强模块 轻量级注意力机制 动态样本分配策略
在线阅读 下载PDF
基于密集连接和多尺度池化的X射线焊缝缺陷分割方法 被引量:1
4
作者 张勇 王鹏 +3 位作者 吕志刚 邸若海 李晓艳 李亮亮 《液晶与显示》 CSCD 北大核心 2024年第1期59-68,共10页
为解决X射线底片焊缝缺陷分割精度不高、边界信息模糊的问题,本文提出一种改进的Dilated_Pooling_Unet(DP_Unet)网络分割模型。首先,在上下采样间加入编解码信息提取模块DP_block,旨在下采样后最大限度地保留原始缺陷语义信息及减少连... 为解决X射线底片焊缝缺陷分割精度不高、边界信息模糊的问题,本文提出一种改进的Dilated_Pooling_Unet(DP_Unet)网络分割模型。首先,在上下采样间加入编解码信息提取模块DP_block,旨在下采样后最大限度地保留原始缺陷语义信息及减少连续卷积与池化操作造成的损失;然后,在模型中添加GAM注意力机制重点关注焊缝缺陷部分,有效提升缺陷特征通道的学习能力,降低背景噪声影响;最后,提出一种融合二元交叉熵和DiceLoss的混合损失函数,用于解决网络训练时不均衡的正负类数据问题。实验数据集由公开数据集GDX-ray缺陷数据集组成。实验结果表明,本文所提方法在GDX-ray数据集上有较好表现,Dice值达到了93.45%,与基线算法相比均有显著提高。该方法具有良好的分割性能,优于传统的分割算法,有效提高了底片焊缝缺陷分割精度。 展开更多
关键词 焊接检测 缺陷分割 DP_Unet 注意力机制
在线阅读 下载PDF
基于改进萤火虫算法的贝叶斯网络结构学习
5
作者 宋楠 邸若海 +3 位作者 王鹏 李晓艳 贺楚超 王储 《科学技术与工程》 北大核心 2024年第26期11314-11322,共9页
贝叶斯网络是目前不确定知识表达和推理领域最有效的理论模型之一,利用贝叶斯网络进行分析和推理前首先需要通过结构学习和参数学习获取其网络模型,其中结构学习是参数学习的基础。针对现有萤火虫算法不符合生物学规则以及学习贝叶斯网... 贝叶斯网络是目前不确定知识表达和推理领域最有效的理论模型之一,利用贝叶斯网络进行分析和推理前首先需要通过结构学习和参数学习获取其网络模型,其中结构学习是参数学习的基础。针对现有萤火虫算法不符合生物学规则以及学习贝叶斯网络结构存在效率低、容易陷入局部最优等问题,设计了一种基于互信息与性别机制的萤火虫算法(firefly algorithm based on mutual information and gender mechanism,MGM-FA)。首先,通过计算节点互信息得到贝叶斯网络骨架图,基于骨架图驱动MGM-FA算法生成初始种群;其次,引入基于性别机制的个性化贝叶斯网络种群更新策略,以保障贝叶斯网络个体的多样性;最后,引入局部优化器和扰动操作符,增强算法的寻优能力。分别在不同规模的标准网络上进行仿真实验,与现有同类型算法相比,该算法精度和效率均有所提升。 展开更多
关键词 贝叶斯网络 结构学习 结构先验 萤火虫算法 MGM-FA算法
在线阅读 下载PDF
基于深度学习的多模态行人检测算法 被引量:13
6
作者 李晓艳 符惠桐 +3 位作者 牛文涛 王鹏 吕志刚 王伟明 《西安交通大学学报》 EI CAS CSCD 北大核心 2022年第10期61-70,共10页
针对全天候工作的多模态行人检测算法体积大、运算量高、效率不足的问题,提出一种基于深度学习MBNet算法搭建的轻量级多模态行人检测算法(G-MBNet)。采用ResNet18算法并结合跨阶段链接的思想搭建CSP-ResNet18轻量级特征提取网络,以保证... 针对全天候工作的多模态行人检测算法体积大、运算量高、效率不足的问题,提出一种基于深度学习MBNet算法搭建的轻量级多模态行人检测算法(G-MBNet)。采用ResNet18算法并结合跨阶段链接的思想搭建CSP-ResNet18轻量级特征提取网络,以保证检测算法精度;引入轻量级高效通道注意力(ECA)模块来提升特征提取网络对重要特征的关注能力,在引入极少参数的情况下提升算法的检测精度;通过引入轻量级Ghost卷积模块来重构MBNet算法的特征提取网络,在保证特征提取性能的情况下进一步降低算法的参数与体积,提升算法的检测速度。采用所提的GMBNet算法在KAIST行人数据集进行测试,实验结果表明:G-MBNet算法大小是原始算法的32.33%,参数量是原始算法的37.81%,检测速度是原始算法的1.53倍;G-MBNet算法可在保证行人识别精度的情况下有效提升检测速度。 展开更多
关键词 行人检测 多模态融合 轻量级网络 Ghost卷积 注意力机制
在线阅读 下载PDF
基于优化SSD的低空无人机检测方法 被引量:7
7
作者 张灵灵 王鹏 +2 位作者 李晓艳 吕志刚 邸若海 《计算机工程与应用》 CSCD 北大核心 2022年第16期204-212,共9页
针对浅层特征缺乏语义信息和小目标特征不显著的问题,提出了一种基于多尺度特征融合和注意力的低空无人机(unmanned aerial vehicle,UAV)检测方法。首先提出一种多尺度特征融合模块,将不同尺度的特征图进行有效融合,使浅层特征图的细节... 针对浅层特征缺乏语义信息和小目标特征不显著的问题,提出了一种基于多尺度特征融合和注意力的低空无人机(unmanned aerial vehicle,UAV)检测方法。首先提出一种多尺度特征融合模块,将不同尺度的特征图进行有效融合,使浅层特征图的细节纹理信息和深层特征图的语义信息得到充分的利用,改善浅层特征语义信息不足的问题。然后在网络特征图输出处引入一种不降维局部跨信道交互策略和核大小自适应选择的通道注意力机制,以极其轻量级的方式获取跨通道的交互信息。为使先验框和有效感受野匹配,优化默认框设置方法,更好地检测小目标。使用自制无人机数据集进行验证,结果表明改进后算法平均准确率为84.07%,比原始SSD(single shot multibox detector)算法提高了7.81个百分点,检测速度达到31.3 frame/s。 展开更多
关键词 目标检测 多尺度特征融合 低空无人机 注意力机制
在线阅读 下载PDF
融合多阶语义增强的JDE多目标跟踪算法 被引量:2
8
作者 王俊 王鹏 +3 位作者 李晓艳 王梁 孙梦宇 郜辉 《西北工业大学学报》 EI CAS CSCD 北大核心 2022年第4期944-952,共9页
为了解决联合检测和嵌入(JDE)算法中目标遮挡以及ID信息与位置信息提取不足造成的目标ID切换问题,提出了融合多阶语义增强的JDE多目标跟踪方法。采用SPA特征空间金字塔注意力模块扩大感受野,获得更丰富的语义信息,提高模型对不同尺度目... 为了解决联合检测和嵌入(JDE)算法中目标遮挡以及ID信息与位置信息提取不足造成的目标ID切换问题,提出了融合多阶语义增强的JDE多目标跟踪方法。采用SPA特征空间金字塔注意力模块扩大感受野,获得更丰富的语义信息,提高模型对不同尺度目标的检测精度;通过FCN网络使检测头和ID Embedding任务协同学习以缓解两者的过度竞争并增强原始语义信息,有效减少ID切换次数;利用PCCs⁃Ma运动度量加强卡尔曼滤波的预测和观察之间的联系,提高运动特征相似度判别的可靠性。为了验证算法的有效性,设计了相同实验环境下JDE算法和所提算法的对比实验。实验结果表明,所提算法模型检测平均精度提高了3.94%。在MOT16数据集上,MOTA和IDF1指标均提高了6.9%,改进后的算法ID切换次数明显减少,取得了良好的跟踪效果。 展开更多
关键词 多目标跟踪 JDE算法 语义信息 SPA 感受野
在线阅读 下载PDF
基于自适应特征感知的轻量化人体姿态估计 被引量:2
9
作者 毋宁 王鹏 +2 位作者 李晓艳 吕志刚 孙梦宇 《液晶与显示》 CAS CSCD 北大核心 2023年第8期1107-1117,共11页
针对现有人体姿态估计网络在追求高精度检测时,网络结构设计复杂、模型参数量较大、检测效率较低的问题,本文提出了一种基于自适应特征感知的轻量级人体姿态估计算法。首先利用轻量化Ghost模块重构人体姿态估计的特征提取网络,减少网络... 针对现有人体姿态估计网络在追求高精度检测时,网络结构设计复杂、模型参数量较大、检测效率较低的问题,本文提出了一种基于自适应特征感知的轻量级人体姿态估计算法。首先利用轻量化Ghost模块重构人体姿态估计的特征提取网络,减少网络参数量;其次设计了一种轻量级自适应特征感知的注意力机制,在降低网络模型复杂度的同时加强通道间信息有效交流,有效改善关键点定位效果;最后采用Huber Loss损失函数优化模型训练,实现异常点的更优预测,增强模型鲁棒性。在COCO数据集上进行验证,实验结果表明,与基准RMPE算法相比,改进后模型的检测精度提升了约0.5%,参数量减少了56.0%,网络运算量降低了32.6%,模型体积压缩了约57.0%,模型检测速率提升约2.1倍。本文改进后的人体姿态估计模型在压缩模型体积的同时提高了检测效率,增强了模型鲁棒性。 展开更多
关键词 人体姿态估计 轻量化 自适应特征感知 Ghost模块 Huber Loss
在线阅读 下载PDF
CIRBlock:融合低代价卷积的轻量反向残差模块 被引量:1
10
作者 余海坤 吕志刚 +3 位作者 王鹏 李晓艳 王洪喜 李亮亮 《计算机工程与应用》 CSCD 北大核心 2023年第20期94-102,共9页
针对轻量级卷积神经网络MobileNet采用的反向残差结构仍具有较多的冗余计算的问题,构建了一种更为轻量的反向残差模块(cheap inverted residuals block,CIRBlock),并设计了一种新的轻量级卷积神经网络CIRNet。通过低代价卷积操作,简化... 针对轻量级卷积神经网络MobileNet采用的反向残差结构仍具有较多的冗余计算的问题,构建了一种更为轻量的反向残差模块(cheap inverted residuals block,CIRBlock),并设计了一种新的轻量级卷积神经网络CIRNet。通过低代价卷积操作,简化逐点卷积,并构建旁路分支进行特征复用,减少反向残差的输出通道;利用通道注意力机制和通道混洗,增强通道间信息交流;在下采样时利用旁路分支信息构建和主分支相同的拓扑结构,提高特征冗余结构的通道多样性;完成轻量化网络模块CIRBlock的设计,并通过人工堆叠CIRBlock构建不同复杂度的轻量级卷积神经网络CIRNet。在目标分类上的实验表明:在CIFAR数据集上,基于相同的VGG16架构,使用CIRBlock比使用MobileNetV2的反向残差结构FLOPs降低58.1%,参数量减少55.5%,分类精度损失小于0.4%。在Mini-ImageNet目标分类数据集上,CIRNet分类精度比MobileNetV2高0.35%,FLOPs降低69%,参数量减少77.4%。 展开更多
关键词 机器视觉 轻量级卷积神经网络 反向残差结构 目标分类
在线阅读 下载PDF
基于感知延伸与锚框最适匹配的遥感图像目标检测算法
11
作者 洪伟 赵祥模 +4 位作者 王鹏 李晓艳 邸若海 吕志刚 王储 《西北工业大学学报》 EI CAS CSCD 北大核心 2023年第4期820-830,共11页
针对遥感图像目标成像小、背景复杂、分布拥挤的问题,将旋转目标检测方法S^(2)ANet作为基线网络,提出一种基于感知延伸与锚框最适匹配的遥感图像目标检测算法(HQ-S^(2)ANet)。构建协同注意力模块(SEA),捕获特征像素间关系的同时扩展模... 针对遥感图像目标成像小、背景复杂、分布拥挤的问题,将旋转目标检测方法S^(2)ANet作为基线网络,提出一种基于感知延伸与锚框最适匹配的遥感图像目标检测算法(HQ-S^(2)ANet)。构建协同注意力模块(SEA),捕获特征像素间关系的同时扩展模型感知区域,实现目标与全局的关系建模;针对遥感图像背景复杂问题,改进特征金字塔(FPN)特征融合过程,在特征融合下采样过程中将感知延伸卷积模块与常规卷积交替堆叠形成感知延伸特征金字塔模块(HQFPN),保证低层细节位置信息的同时,延伸感知范围以增强模型信息捕捉能力;为解决遥感目标图像分布拥挤的问题,利用高质量锚框匹配方法(MaxIoUAssigner-HQ),通过常数因子控制锚框真值分配,在保证召回率的同时,防止低质量锚框匹配产生。实验结果表明,在DOTA数据集下,与S^(2)ANet算法相比,HQ-S^(2)ANet平均精度(mAP)提高3.1%,召回率(Recall)均值提高1.6%,而参数量仅增加2.61M,所提算法有效增强了遥感图像目标检测能力。 展开更多
关键词 遥感图像 特征融合 锚框匹配 旋转检测
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部