期刊文献+
共找到336篇文章
< 1 2 17 >
每页显示 20 50 100
MHVTs:多尺度混合视觉自注意力模型
1
作者 高丽丽 应文豪 +2 位作者 钟珊 胡文军 吴晓宇 《计算机工程与设计》 北大核心 2025年第5期1395-1402,共8页
为提高ViT模型在小型数据集上从零开始训练的性能,提出一种多尺度混合ViT模型(MHVT),由多尺度扩张局部聚集模块(MDLA)和多尺度先下采样再上采样模块(MPUA)组成。MDLA利用不同膨胀率的深度可分卷积在不同通道上提取不同尺度的局部特征。M... 为提高ViT模型在小型数据集上从零开始训练的性能,提出一种多尺度混合ViT模型(MHVT),由多尺度扩张局部聚集模块(MDLA)和多尺度先下采样再上采样模块(MPUA)组成。MDLA利用不同膨胀率的深度可分卷积在不同通道上提取不同尺度的局部特征。MPUA在自注意力计算前,在不同的通道上对查询、键和值进行不同粒度的池化处理,保持计算效率的同时捕获多尺度的全局特征。在各种小尺寸数据集上的大量实验验证了MHVT在精度和速度方面均获得了更好的权衡。 展开更多
关键词 视觉自注意力模型 局部相关性 多尺度特征交互 卷积神经网络 小型数据集 自注意力模型 卷积神经网络
在线阅读 下载PDF
结合语言模型双编码和坐标注意力卷积的知识图谱补全
2
作者 王瑄 王晓霞 陈晓 《计算机工程与应用》 北大核心 2025年第14期206-213,共8页
知识图谱补全(KGC)旨在学习知识图谱中的现有知识实现对缺失三元组的补全。近期的相关研究表明,将语言模型(LM)应用于KGC任务能够改善模型在结构稀疏的知识图谱上的推理性能。针对现有结合LM的KGC模型性能仅依赖于LM捕获的语义特征,没... 知识图谱补全(KGC)旨在学习知识图谱中的现有知识实现对缺失三元组的补全。近期的相关研究表明,将语言模型(LM)应用于KGC任务能够改善模型在结构稀疏的知识图谱上的推理性能。针对现有结合LM的KGC模型性能仅依赖于LM捕获的语义特征,没有同时考虑知识图谱的结构信息和语义信息的问题,提出一种结合语言模型双编码和坐标注意的知识图谱补全方法LDCA。在编码时,通过引入掩码预训练的语言模型双编码结构,充分学习实体和关系的语义特征;在解码时,使用坐标注意力机制的卷积神经网络捕获实体和关系组合嵌入的跨通道信息、方向感知信息和位置感知信息。在WN18RR和FB15K-237数据集上的实验结果表明,LDCA模型在MR、MRR、Hits@1、Hits@3和Hits@10上的整体性能优于基准模型,验证了所提出模型的有效性和先进性。 展开更多
关键词 语言模型(LM) 掩码预训练 坐标注意力机制 卷积神经网络
在线阅读 下载PDF
基于混合注意力卷积模型的地铁乘降通道客流检测算法研究
3
作者 陈文昊 刘伟铭 董佳勋 《铁道标准设计》 北大核心 2025年第9期186-194,共9页
在无人驾驶地铁运营线路中,后台控制系统需要实时检测和分析客流信息数据,及时发现异常情况。针对现有模型种类单一、可改进程度低、硬件成本限制等问题,提出一种基于混合注意力卷积模型的客流检测算法。该算法将CNN模型与ViT模型结合起... 在无人驾驶地铁运营线路中,后台控制系统需要实时检测和分析客流信息数据,及时发现异常情况。针对现有模型种类单一、可改进程度低、硬件成本限制等问题,提出一种基于混合注意力卷积模型的客流检测算法。该算法将CNN模型与ViT模型结合起来,使用即插即用的ECA注意力模块和深度可分离卷积优化内部结构,优化特征提取能力的同时提升模型检测速度。在深层ViT结构中,提出一种新型模型轻量化方法,进一步简化模型,改善ViT中注意力计算量大的问题。算法通过融合所有不同尺度的最终特征图,得到检测结果热力图。数据样本基于顶装摄像头拍摄,可以有效规避遮挡问题。某地铁站台真实乘降数据集采集及实验结果表明,提出的方法在一般样本数据集下的平均检测精度达到97.4%,在困难样本数据集下的平均检测精度达到89.3%,相比其他模型能更好地检测小尺度乘客目标;在性能更优的同时,实时检测速度达到50帧/s,相比同类模型平均检测速度加快45%。本研究为地铁客流场景提供一种新颖的检测算法,能够有效提高低成本设备的检测性能与速度,为后续客流跟踪和异常检测提供基础。 展开更多
关键词 地铁 乘降通道 注意力机制 卷积模型 客流检测 轻量化
在线阅读 下载PDF
融合并行多卷积注意力的扩散模型去雾方法
4
作者 崔欣桐 王瑛 +3 位作者 邓真楠 王浚瞩 梁铮 邓红霞 《计算机工程与设计》 北大核心 2025年第7期2081-2088,共8页
针对目前去雾方法细节模糊、对真实环境去雾不彻底等问题,提出一种融合并行多卷积注意力的条件扩散模型。将有雾图像作为条件先验引入扩散模型,提升扩散模型对尘雾的理解能力;设计构建并行多卷积注意力残差块,通过不同尺度卷积和不同注... 针对目前去雾方法细节模糊、对真实环境去雾不彻底等问题,提出一种融合并行多卷积注意力的条件扩散模型。将有雾图像作为条件先验引入扩散模型,提升扩散模型对尘雾的理解能力;设计构建并行多卷积注意力残差块,通过不同尺度卷积和不同注意力机制加强模型对尘雾区域的关注,提升模型对有雾图像的特征提取能力;使用SKFusion进行带权特征融合,更大限度保留重要的浅层特征;使用双3次下采样和拉普拉斯金字塔处理图像,降低模型参数和计算复杂度。通过将该方法与其它方法在不同数据集进行多种对比实验和消融实验,验证了该方法在图像去雾上的有效性。 展开更多
关键词 图像去雾 深度学习 扩散模型 并行多卷积注意力 深度可分离卷积 残差连接 多尺度特征融合
在线阅读 下载PDF
CAREx:基于多层卷积和注意力机制的可解释生成推荐模型
5
作者 陆文韬 彭敦陆 《小型微型计算机系统》 北大核心 2025年第5期1072-1080,共9页
模型的可解释性提供了向用户推荐一个项目背后的原因,以此提高用户的满意度.一种解释建议的方法是为用户-项目对生成个性化自然语言评论,但评论的质量不尽如人意.此外,使用底层语言模型生成文本的效率也不高.本文提出一种基于自适应语... 模型的可解释性提供了向用户推荐一个项目背后的原因,以此提高用户的满意度.一种解释建议的方法是为用户-项目对生成个性化自然语言评论,但评论的质量不尽如人意.此外,使用底层语言模型生成文本的效率也不高.本文提出一种基于自适应语言模型的上下文感知可解释推荐模型,在预测出准确评分的同时,采用即插即用语言模型生成解释推荐结果的评论.为提升准确性,模型使用交叉Branchformer网络同时捕获全局和局部信息,从评论集中找到最相似的评论作为受限文本.随后,模型训练了一个轻量化鉴别器得到情感评分并将文本一起输入到预训练语言模型中来生成最后的评论.实验结果表明,本文提出的模型生成的评论在语义上接近金标事实评论,具有较高的可解释性. 展开更多
关键词 可解释推荐系统 多层卷积 注意力网络 即插即用的语言模型
在线阅读 下载PDF
基于近红外光谱的连续小波变换与卷积注意力模块建立秦艽的定性分析模型
6
作者 周玉 李四海 +1 位作者 李坤鹏 王泽朋 《理化检验(化学分册)》 北大核心 2025年第4期436-442,共7页
针对近红外光谱的处理研究大多聚焦于对原始的一维光谱信号直接进行卷积特征抽取,为了更加全面地挖掘光谱数据中的信息,提高分类模型的建模效果,提出了连续小波变换与卷积注意力模块建立秦艽定性分析模型的方法。采用连续小波变换将一... 针对近红外光谱的处理研究大多聚焦于对原始的一维光谱信号直接进行卷积特征抽取,为了更加全面地挖掘光谱数据中的信息,提高分类模型的建模效果,提出了连续小波变换与卷积注意力模块建立秦艽定性分析模型的方法。采用连续小波变换将一维的信号转换为二维图像表现形式,以得到的小波时频图作为光谱特征,建立具有注意力机制的秦艽近红外光谱的卷积神经网络定性分析模型Att-GoogleNet,并通过翻转、对比度增强以及加入高斯噪声来扩充数据集实现数据增强,提高模型的泛化能力。结果表明:对207个秦艽样品的产地进行分析,Att-GooogleNet模型的分类准确率为99.6%,准确率、精确率、召回率、特异度、F1分数均优于传统机器学习模型。 展开更多
关键词 近红外光谱 连续小波变换 卷积神经网络 注意力机制 模型 秦艽
在线阅读 下载PDF
基于通用视觉大模型与注意力增强的无监督异常检测
7
作者 王镇 翟轲 +1 位作者 薛赛 白双 《北京交通大学学报》 北大核心 2025年第3期14-22,共9页
针对现有无监督异常检测方法普遍存在特征提取不充分和不能有效关注异常区域导致检测性能下降的问题,提出一种基于通用视觉大模型——视觉变换器(Vision Transformer,ViT)与注意力增强的无监督异常检测方法.首先,利用预训练的通用视觉Vi... 针对现有无监督异常检测方法普遍存在特征提取不充分和不能有效关注异常区域导致检测性能下降的问题,提出一种基于通用视觉大模型——视觉变换器(Vision Transformer,ViT)与注意力增强的无监督异常检测方法.首先,利用预训练的通用视觉ViT模型对输入图像进行特征提取.其次,为进一步增强模型对异常区域的关注度,引入通道与空间注意力模块(Convolutional Block At-tention Module,CBAM),在特征提取阶段自适应调整特征权重,以更精准地捕捉局部异常信息.最后,本文在MVTec工业数据集与自制钢缆异常数据集上进行了大量实验,全面评估所提方法的检测性能.实验结果表明:所提方法在无监督异常检测任务上优于同期多种主流方法.在钢缆异常数据集上,所提方法的图像级受试者特征曲线下面积(Image-wise Area Under ROC,Image-wise AUROC)和F1-Score平均值分别达到88.1%和80.8%,较基准Fastflow算法提升了11.7%和7.8%. 展开更多
关键词 异常检测 无监督检测 机器视觉 视觉模型 注意力机制
在线阅读 下载PDF
融合注意力机制的MacBERT-DPCNN农业文本分类模型
8
作者 张典 刘畅 +2 位作者 陈雯柏 缪祎晟 吴华瑞 《中国农机化学报》 北大核心 2025年第8期83-89,共7页
针对农业领域文本信息密度大、语义模糊、特征稀疏的特点,提出一种基于MacBERT(MLM as correction-BERT)、深度金字塔卷积网络(DPCNN)和注意力机制(Attention)的农业文本分类模型,命名为MacBERT—DPCNN—Attention(MDA)。首先,使用MacB... 针对农业领域文本信息密度大、语义模糊、特征稀疏的特点,提出一种基于MacBERT(MLM as correction-BERT)、深度金字塔卷积网络(DPCNN)和注意力机制(Attention)的农业文本分类模型,命名为MacBERT—DPCNN—Attention(MDA)。首先,使用MacBERT模型充分提取农业类文本内容的上下文信息,强化文本的语义特征表示。然后,DPCNN模型通过其多层卷积神经网络和池化操作,有效捕获文本的局部特征。最后,注意力机制进一步增强农业文本序列的特征表达。结果表明,与其他主流模型如BERT—DPCNN、BERT—CNN、BERT—RNN相比,MDA模型在农业文本分类任务上的精确率提升1.04%以上,召回率提升0.95%以上,F1值提升0.14%以上。表明所提模型在解决农业领域文本分类问题方面的有效性和优越性。 展开更多
关键词 农业文本分类 MacBERT模型 深度金字塔卷积网络 注意力机制 预训练模型
在线阅读 下载PDF
改进卷积注意力机制的轻量级检测无人机目标模型
9
作者 彭艺 李睿 +1 位作者 杨青青 凃馨月 《兰州大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第4期528-535,共8页
利用深度学习中特征提取的优势,提出一种改进算法,结合改进的卷积注意力模块,将YOLOv5模型骨干网络替换为改进的MobileNetv2轻量化网络,形成I-YOLOv5算法,旨在提高检测精确度和小目标、多目标的检测能力,同时保持实时性.为构建数据集,... 利用深度学习中特征提取的优势,提出一种改进算法,结合改进的卷积注意力模块,将YOLOv5模型骨干网络替换为改进的MobileNetv2轻量化网络,形成I-YOLOv5算法,旨在提高检测精确度和小目标、多目标的检测能力,同时保持实时性.为构建数据集,通过网络搜索和自主录制无人机视频的方式,用Label Img工具完成标注.结果表明,I-YOLOv5算法在检测精度上有显著提升,对小目标和多目标的检测效果更优秀,在视频检测方面表现出色,具有较好的实时性能.通过模型结构优化,使检测模型的大小减少为原来的18.6%,检测速度提升120%.I-YOLOv5算法的平均精度均值达到97.8%. 展开更多
关键词 无人机 目标检测 YOLOv5模型 卷积注意力机制 轻量化
在线阅读 下载PDF
基于融合注意力机制的盾构姿态组合预测模型研究 被引量:1
10
作者 刘哲 许超 熊栋栋 《隧道建设(中英文)》 北大核心 2025年第1期139-150,共12页
针对盾构姿态预测模型存在易过拟合、预测精度低的问题,提出一种基于融合注意力机制的盾构姿态组合预测模型。为强化有效特征的提取,抑制冗余特征信息的表达,引入基于选择性卷积核网络(selective kernel networks,SKNet)的特征注意力机... 针对盾构姿态预测模型存在易过拟合、预测精度低的问题,提出一种基于融合注意力机制的盾构姿态组合预测模型。为强化有效特征的提取,抑制冗余特征信息的表达,引入基于选择性卷积核网络(selective kernel networks,SKNet)的特征注意力机制提取网络,消除固定尺寸卷积核带来的限制,并自适应形成带有注意力的特征映射。为更好地捕捉长期信息和特征模式,通过双向长短期记忆网络(bidirectional long short-term memory,BiLSTM)、门控循环单元(gated recurrent unit, GRU)得到2组隐含输出结果,再利用多头注意力机制,捕获组合模型输出的隐含特征与模型输出的盾构姿态之间的依赖关系,进一步提高预测模型对重要隐含特征的信息抓捕能力;同时,为解决地质勘察钻孔数据连续性差、精确性不足,难以应用于机器学习模型训练的问题,将基于人工先验知识的二级特征引入模型特征输入,提升模型对地层信息的感知能力。最后,基于广州地铁12号线官洲站—大学城北站盾构实例,对模型不同参数结构下的性能进行研究,并进行对比试验验证模型性能,采用可解释性试验评估特征对预测结果的影响。试验结果表明,相比其他预测模型,所提出的预测模型优越性更好,预测精度更高,解决了长时间序列高特征维度数据在传统模型下易过拟合且预测精度较低的问题。 展开更多
关键词 盾构姿态预测 选择性卷积核网络 特征注意力 组合模型 多头注意力机制
在线阅读 下载PDF
基于多粒度时空注意力机制的说话人识别模型
11
作者 朱文博 吴靖 +2 位作者 金浩 叶维彰 朱珍 《声学技术》 北大核心 2025年第1期93-101,共9页
深度学习已广泛应用在说话人识别领域,但当前模型存在识别率低和模型参数复杂度高的问题,难以进行轻量化语音识别。针对此问题,文章提出一种基于多粒度时空注意力机制的说话人识别模型,该模型由多粒度混合模块、时空注意力机制模块、通... 深度学习已广泛应用在说话人识别领域,但当前模型存在识别率低和模型参数复杂度高的问题,难以进行轻量化语音识别。针对此问题,文章提出一种基于多粒度时空注意力机制的说话人识别模型,该模型由多粒度混合模块、时空注意力机制模块、通道压缩模块组成。其中多粒度混合模块和时空注意力机制模块以多尺度建模角度来捕捉局部时序上下文特征和空间关联特征信息,并通过多粒度方式耦合不同时空信息的关联特征以提高全局时空建模能力。同时,通道压缩模块通过聚合不同说话人信道以及上下文语境依赖表征以减少整体模型参数数量。在多组公开数据集上进行五重交叉验证实验,结果表明:对比主流模型,所提方法能够有效地提高说话人识别准确率、降低参数量,并达到最优的表现,在轻量化说话人识别模型方面具有重要的应用价值。 展开更多
关键词 深度学习 卷积神经网络 说话人识别 注意力机制 轻量化模型
在线阅读 下载PDF
基于注意力机制的CNN-BiLSTM模型磨粒含量预测
12
作者 么大钊 邢广笑 +1 位作者 冯伟 周新聪 《润滑与密封》 北大核心 2025年第5期122-129,共8页
磨粒含量是反映机械设备磨损状况的重要指标,精确预测磨粒含量对于设备的维护和故障预防具有重要意义。针对多变量影响的磨粒含量序列非线性、时序性等特征,提出一种基于注意力机制的CNN-BiLSTM磨粒含量预测模型。该模型利用皮尔森相关... 磨粒含量是反映机械设备磨损状况的重要指标,精确预测磨粒含量对于设备的维护和故障预防具有重要意义。针对多变量影响的磨粒含量序列非线性、时序性等特征,提出一种基于注意力机制的CNN-BiLSTM磨粒含量预测模型。该模型利用皮尔森相关系数法分析并筛选与磨粒含量较高相关性的变量作为模型输入,利用一维卷积神经网络(1D-CNN)提取输入变量的局部特征,并通过双向长短期记忆网络(BiLSTM)捕捉磨粒含量时间序列中的双向依赖关系,最后采用注意力机制(Attention Mechanism)对磨粒含量序列中的重要特征进行加权处理,进一步提高预测性能。根据采集到的销盘摩擦磨损试验数据进行实验分析,结果表明,基于注意力机制的CNN-BiLSTM磨粒含量预测模型具有较高的预测精度和稳定性,可以为机械设备磨损状态监测和维护提供更准确的依据。 展开更多
关键词 注意力机制 预测模型 卷积神经网络 双向长短期记忆网络 磨损状态监测
在线阅读 下载PDF
基于视觉自注意力模型的苗期玉米与杂草检测方法 被引量:4
13
作者 唐伯青 赵大勇 +1 位作者 熊锋 李德强 《南京农业大学学报》 CAS CSCD 北大核心 2024年第4期772-781,共10页
[目的]识别作物和杂草是农业智能化中自动除草的关键步骤。本文旨在解决作物与杂草识别精度低、检测模型实时性和鲁棒性差等问题。[方法]以叶龄处于3~8叶期的玉米及其伴生杂草为研究对象,提出一种高效准确的玉米苗与杂草的检测方法。该... [目的]识别作物和杂草是农业智能化中自动除草的关键步骤。本文旨在解决作物与杂草识别精度低、检测模型实时性和鲁棒性差等问题。[方法]以叶龄处于3~8叶期的玉米及其伴生杂草为研究对象,提出一种高效准确的玉米苗与杂草的检测方法。该方法以实时端到端目标检测视觉自注意力模型为基础框架,用小尺度卷积等效替代大尺度深度卷积的思想,以较小的精度损失降低推理耗时。引入一种包含上下文信息的自顶向下注意力机制,强化模型对小目标的检测效果。应用组合图像增强策略,提升模型精度与泛化能力。[结果]改进后模型的平均检测精度为90.11%,推理阶段单张图片耗时33.67 ms,模型参数量44.86 MB。改进后的模型比主流目标检测模型总体精度更高,且推理速度快。[结论]所提方法对于玉米苗与伴生杂草的整体检测性能优秀,能够提高杂草识别的准确性和效率。 展开更多
关键词 玉米 杂草 检测 实时视觉自注意力模型 等效卷积 图像增强
在线阅读 下载PDF
AConvLSTM U-Net:基于双向稠密连接和注意力机制的多尺度颌骨囊肿分割模型
14
作者 李苏强 王周阳 +1 位作者 产思贤 周小龙 《南方医科大学学报》 北大核心 2025年第5期1082-1092,共11页
目的提出一种基于双向稠密连接和注意力机制的多尺度颌骨囊肿分割模型(AConvLSTM U-Net),实现颌骨囊肿图像的准确自动分割。方法使用含有2592张颌骨囊肿图像数据集。首先,AConvLSTM U-Net在编码路径上设计移动翻转瓶颈卷积模块(MBC)以... 目的提出一种基于双向稠密连接和注意力机制的多尺度颌骨囊肿分割模型(AConvLSTM U-Net),实现颌骨囊肿图像的准确自动分割。方法使用含有2592张颌骨囊肿图像数据集。首先,AConvLSTM U-Net在编码路径上设计移动翻转瓶颈卷积模块(MBC)以增强特征提取能力。其次,采用双路径稠密卷积(DPD)连接编码器和解码器,在跳跃连接中引入双向ConvLSTM以获取丰富的语义信息。然后,解码路径上使用基于空间和通道注意力的解码块(scSE),以提升对重要信息的关注。最后,设计了全尺寸深度监督模块(DS),并结合联合损失函数对模型进行优化,以进一步提高分割精度。结果AConvLSTM U-Net在颌骨囊肿病灶分割的实验结果在MCC、DSC和JSC方面分别达到93.8443%、93.9067%、88.5133%,性能均优于所有被比较的分割模型。结论所提出的算法在颌骨囊肿数据集上表现出较高的准确性与鲁棒性,优于多种主流方法,展现了AConvLSTM U-Net在颌骨囊肿图像分割的优越性能和辅助诊断的巨大潜力。 展开更多
关键词 注意力机制 多尺度颌骨囊肿分割模型 稠密卷积
在线阅读 下载PDF
基于注意力卷积神经网络的视觉里程计 被引量:1
15
作者 高学金 牟雨曼 任明荣 《控制工程》 CSCD 北大核心 2024年第6期1060-1066,共7页
传统的视觉里程计(visual odometry,VO)要求图像含有大量的纹理信息,且求解过程较为复杂。针对以上问题提出基于注意力卷积神经网络的视觉里程计,对相机进行端到端的位姿估计,利用注意力机制提高模型估计轨迹的精度。首先,使用注意力-... 传统的视觉里程计(visual odometry,VO)要求图像含有大量的纹理信息,且求解过程较为复杂。针对以上问题提出基于注意力卷积神经网络的视觉里程计,对相机进行端到端的位姿估计,利用注意力机制提高模型估计轨迹的精度。首先,使用注意力-卷积神经网络(convolutional neural networks,CNN)模块提取图像特征;然后,将特征输入到门控循环单元(gated recurrent unit,GRU)学习图像的时序连接性;最后,通过全连接层降维输出相机位姿。在KITTI数据集上完成实验,并与其他方法进行对比,结果表明卷积网络中加入注意力机制可以有效提高轨迹估计的精度,且误差低于其他视觉里程计算法。 展开更多
关键词 视觉里程计 注意力机制 卷积神经网络 门控循环单元
在线阅读 下载PDF
融合注意力机制和多层动态形变卷积的多视图立体视觉重建方法 被引量:1
16
作者 孙凯 张成 +1 位作者 詹天 苏迪 《兵工学报》 EI CAS CSCD 北大核心 2024年第10期3631-3641,共11页
针对现有多视图立体视觉(Multi-View Stereo,MVS)技术提取弱纹理区域和非郎伯体曲面特征信息不充分及重建效果不理想问题,提出一种融合注意力机制和多层动态形变卷积的AMDC-PatchmatchNet方法。构建一种融合坐标注意力的特征提取网络,... 针对现有多视图立体视觉(Multi-View Stereo,MVS)技术提取弱纹理区域和非郎伯体曲面特征信息不充分及重建效果不理想问题,提出一种融合注意力机制和多层动态形变卷积的AMDC-PatchmatchNet方法。构建一种融合坐标注意力的特征提取网络,能更准确地捕捉重建对象的边缘形状和纹理特征,同时融合一种基于动态形变卷积的自适应感受野模块,根据不同尺度的特征自适应调整感受野的大小和形状,获得兼具全局和细节的特征表示。在DTU数据集上的测试结果表明,所提方法相较于主流MVS方法,点云重建整体性指标提高2.8%,并且在航空影像数据集上验证了模型的泛化能力。 展开更多
关键词 多视图立体视觉 注意力机制 动态形变卷积 深度学习
在线阅读 下载PDF
卷积协同注意力模型下的作物幼苗与杂草识别
17
作者 闫可 张聪 +2 位作者 陈新波 成泞伸 魏志慧 《江苏农业科学》 北大核心 2024年第13期188-196,共9页
在农作物的杂草防治中,部分杂草与作物幼苗的形态相似且颜色相近,导致杂草不易被快速准确识别。针对田间作物幼苗与杂草识别精度不高的问题,提出了一种卷积协同注意力模型(CCA-ViT)。该模型以视觉Transformer模型为基础,采用跨尺度金字... 在农作物的杂草防治中,部分杂草与作物幼苗的形态相似且颜色相近,导致杂草不易被快速准确识别。针对田间作物幼苗与杂草识别精度不高的问题,提出了一种卷积协同注意力模型(CCA-ViT)。该模型以视觉Transformer模型为基础,采用跨尺度金字塔架构,加强图像浅层信息与深层语义的交互。为提高相似作物与杂草的特征判别能力,在特征提取网络中构建了卷积协同注意力机制,优先关注叶片的纹理和边缘细小特征,获取局部信息注意力权重后协同全局特征进行建模。并在全局建模前引入可移动位置编码捕获感受野的同时降低模型的复杂度。将该模型用于识别小麦、玉米等6种作物幼苗与雀麦、猪殃殃等6种杂草上,识别准确率比同类规模的视觉Transformer模型提高了1.91百分点,达到了97.81%。同时该模型用于田间小麦和玉米幼苗的实际预测准确率也能达到80%以上。体现出该模型可用于复杂背景下具有纹理细小特征的作物幼苗与杂草的识别,能够对形态相似、颜色相近的作物幼苗与杂草进行有效区分。 展开更多
关键词 作物幼苗与杂草识别 跨尺度金字塔架构 卷积协同注意力机制 可移动位置编码 Transformer模型
在线阅读 下载PDF
基于注意力卷积长短时记忆模型的城市出租车流量预测
18
作者 周新民 金江涛 +2 位作者 鲍娜娜 袁涛 崔烨 《中国安全科学学报》 CAS CSCD 北大核心 2024年第7期153-162,共10页
为解决城市交通拥堵和安全问题,提出一种注意力卷积长短时记忆(ConvLSTM)残差(ACLR)模型,该模型通过结合ConvLSTM、注意力机制和残差结构,分别处理出租车流量的时间、空间、和其他特征,挖掘区域兴趣点(POI)数据对出租车流量的影响,有效... 为解决城市交通拥堵和安全问题,提出一种注意力卷积长短时记忆(ConvLSTM)残差(ACLR)模型,该模型通过结合ConvLSTM、注意力机制和残差结构,分别处理出租车流量的时间、空间、和其他特征,挖掘区域兴趣点(POI)数据对出租车流量的影响,有效提升交通时空特征的提取能力。同时,引入专门的学习元件考虑外部因素和POI密度对交通流量的影响,并利用北京市出租车轨迹数据验证。结果表明:ACLR模型在城市交通流预测中的精度高于差分自回归滑动平均(ARIMA)模型、长短时记忆(LSTM)网络、深度时空残差网络(ST-ResNet)、卷积神经网络(CNN)-残差神经单元-LSTM(CRL)循环神经网络、ACFM等模型,在无POI密度和考虑POI密度的情况下,均有助于提升模型的预测性能,ACLA模型的预测值与真实值基本一致,高峰时段也能与真实值较好地吻合,有效提升交通时空特征的提取能力,降低预测误差,使得交通流量预测性能得到优化。 展开更多
关键词 注意力卷积长短时记忆残差网络(ACLR)模型 交通流量预测 城市出租车 时空特征 残差结构
在线阅读 下载PDF
基于Depth-wise卷积和视觉Transformer的图像分类模型 被引量:6
19
作者 张峰 黄仕鑫 +1 位作者 花强 董春茹 《计算机科学》 CSCD 北大核心 2024年第2期196-204,共9页
图像分类作为一种常见的视觉识别任务,有着广阔的应用场景。在处理图像分类问题时,传统的方法通常使用卷积神经网络,然而,卷积网络的感受野有限,难以建模图像的全局关系表示,导致分类精度低,难以处理复杂多样的图像数据。为了对全局关... 图像分类作为一种常见的视觉识别任务,有着广阔的应用场景。在处理图像分类问题时,传统的方法通常使用卷积神经网络,然而,卷积网络的感受野有限,难以建模图像的全局关系表示,导致分类精度低,难以处理复杂多样的图像数据。为了对全局关系进行建模,一些研究者将Transformer应用于图像分类任务,但为了满足Transformer的序列化和并行化要求,需要将图像分割成大小相等、互不重叠的图像块,破坏了相邻图像数据块之间的局部信息。此外,由于Transformer具有较少的先验知识,模型往往需要在大规模数据集上进行预训练,因此计算复杂度较高。为了同时建模图像相邻块之间的局部信息并充分利用图像的全局信息,提出了一种基于Depth-wise卷积的视觉Transformer(Efficient Pyramid Vision Transformer,EPVT)模型。EPVT模型可以实现以较低的计算成本提取相邻图像块之间的局部和全局信息。EPVT模型主要包含3个关键组件:局部感知模块(Local Perceptron Module,LPM)、空间信息融合模块(Spatial Information Fusion,SIF)和“+卷积前馈神经网络(Convolution Feed-forward Network,CFFN)。LPM模块用于捕获图像的局部相关性;SIF模块用于融合相邻图像块之间的局部信息,并利用不同图像块之间的远距离依赖关系,提升模型的特征表达能力,使模型学习到输出特征在不同维度下的语义信息;CFFN模块用于编码位置信息和重塑张量。在图像分类数据集ImageNet-1K上,所提模型优于现有的同等规模的视觉Transformer分类模型,取得了82.6%的分类准确度,证明了该模型在大规模数据集上具有竞争力。 展开更多
关键词 深度学习 图像分类 Depth-wise卷积 视觉Transformer 注意力机制
在线阅读 下载PDF
融合小尺寸动态蛇形卷积的太阳能电池板检测YOLO模型
20
作者 汪宇玲 常佳熠 《现代电子技术》 北大核心 2025年第11期114-120,共7页
针对太阳能电池板表面缺陷检测任务中检测精度低的问题,提出一种融合小尺寸动态蛇形卷积的太阳能电池板检测YOLO模型。主要设计了可适应管束状瑕疵的小尺寸动态蛇形卷积,增强了模型对裂纹缺陷的表征能力;同时在模型颈部加入高效通道注... 针对太阳能电池板表面缺陷检测任务中检测精度低的问题,提出一种融合小尺寸动态蛇形卷积的太阳能电池板检测YOLO模型。主要设计了可适应管束状瑕疵的小尺寸动态蛇形卷积,增强了模型对裂纹缺陷的表征能力;同时在模型颈部加入高效通道注意力机制,并融合加权梯度特征,增强了对关键特征的提取能力。所提方法基于公开数据集进行仿真实验,实验mAP@0.5可达88.1%,相较于YOLOv7、Faster R-CNN、YOLOX-S的平均精度均值分别提高了5%、15.8%、1.6%,可以更准确地完成太阳能电池表面缺陷检测任务。 展开更多
关键词 太阳能电池板 缺陷检测 梯度信息 动态蛇形卷积 高效通道注意力机制 YOLO模型
在线阅读 下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部