期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
改进量化注意力机制和权重的剩余使用寿命预测模型 被引量:1
1
作者 罗冲 何启学 韩超 《计算机应用》 北大核心 2025年第S1期366-371,共6页
设备剩余使用寿命(RUL)预测在工业维护中扮演着关键角色,它的准确性和效率对设备管理和故障预防至关重要。近年来,深度学习技术在RUL预测中展现出巨大潜力,而它的高计算成本和复杂性限制了它在资源受限环境中的应用。针对该问题,提出一... 设备剩余使用寿命(RUL)预测在工业维护中扮演着关键角色,它的准确性和效率对设备管理和故障预防至关重要。近年来,深度学习技术在RUL预测中展现出巨大潜力,而它的高计算成本和复杂性限制了它在资源受限环境中的应用。针对该问题,提出一种改进量化注意力机制和权重的RUL预测模型用于提升RUL预测的性能和效率。首先,将模型权重量化为低精度整数,以显著降低模型的存储需求和计算开销,同时引入正则化效果,提升模型的泛化能力;其次,采用量化注意力机制,通过二元运算近似表达点积运算,减少浮点运算,简化注意力计算过程,节约内存,提升模型效率,增强模型的可解释性和鲁棒性。在C-MAPSS数据集上的实验结果表明,所提模型在保证预测精度的前提下,大幅降低了模计算成本,在C-MAPSS数据集上,与原始注意力模型相比,所提方法的内存开销减少了约25%,计算时间缩短了39.83%~55.49%。 展开更多
关键词 剩余使用寿命预测 量化注意力机制 量化 深度学习 工业维护
在线阅读 下载PDF
基于光照权重分配和注意力的红外与可见光图像融合深度学习模型
2
作者 魏文亮 王阳萍 +2 位作者 岳彪 王安政 张哲 《计算机应用》 CSCD 北大核心 2024年第7期2183-2191,共9页
针对现有红外与可见光图像融合模型在融合过程中忽略光照因素、使用常规的融合策略,导致融合结果存在细节信息丢失、显著信息不明显等问题,提出一种基于光照权重分配和注意力的红外与可见光图像融合深度学习模型。首先,设计光照权重分... 针对现有红外与可见光图像融合模型在融合过程中忽略光照因素、使用常规的融合策略,导致融合结果存在细节信息丢失、显著信息不明显等问题,提出一种基于光照权重分配和注意力的红外与可见光图像融合深度学习模型。首先,设计光照权重分配网络(IWA-Net)来估计光照分布并计算光照权重;其次,引入CM-L1范式融合策略提高像素之间的依赖关系,完成对显著特征的平滑处理;最后,由全卷积层构成解码网络,完成对融合图像的重构。在公开数据集上的融合实验结果表明,所提模型相较于对比模型,所选六种评价指标均有所提高,其中空间频率(SF)和互信息(MI)指标分别平均提高了45%和41%,有效减少边缘模糊,使融合图像具有较高的清晰度和对比度。该模型的融合结果在主客观方面均优于其他对比模型。 展开更多
关键词 红外与可见光图像 图像融合 光照分配 融合策略 注意力机制
在线阅读 下载PDF
融合注意机制的多尺度自适应空洞卷积面部情感识别方法
3
作者 王春影 孟天宇 +2 位作者 张震 葛雄心 杨继伟 《重庆理工大学学报(自然科学)》 北大核心 2025年第5期90-97,共8页
针对面部不连续动作单元的关联特征提取困难,以及不同面部区域对表情识别影响程度不一可能引入无用信息的问题,提出了一种基于双分支注意力机制的多尺度自适应空洞卷积模型(dual branching attention mechanism-adaptive multi-scale di... 针对面部不连续动作单元的关联特征提取困难,以及不同面部区域对表情识别影响程度不一可能引入无用信息的问题,提出了一种基于双分支注意力机制的多尺度自适应空洞卷积模型(dual branching attention mechanism-adaptive multi-scale dilated convolution,DAM-ADCNN)。模型通过双分支注意力机制生成特征映射,表征面部动作单元的局部和全局分布及关联关系;利用多尺度空洞卷积提取面部不连续动作单元的关键特征;采用自适应方式动态调整不同尺度关联特征的权重,以有效减少无用信息的干扰。结果表明,DAM-ADCNN模型在情感识别任务中的表现优于现有方法。在DEAP数据集的唤醒和效价维度上,模型的识别准确率分别提升了3.66%和3.99%。同时,在CK+数据集上,模型的识别准确率提高了3.93%。这些结果证明了DAM-ADCNN模型在面部表情情感识别中的有效性。 展开更多
关键词 面部情感识别 双分支注意力机制 空洞卷积 自适应
在线阅读 下载PDF
基于对抗性注意力机制的行人再识别攻击方法
4
作者 张琳钰 王进 +1 位作者 万杰 刘国庆 《计算机工程与设计》 北大核心 2024年第5期1565-1571,共7页
针对行人再识别系统鲁棒性的问题,提出一种基于对抗性注意力机制的行人再识别攻击方法。将通道注意力机制嵌入改造过的ResNet50网络,提取整个行人的显著特征;利用重新设计的掩码打破原注意力权重,混淆关注区域,降低行人再识别模型的识... 针对行人再识别系统鲁棒性的问题,提出一种基于对抗性注意力机制的行人再识别攻击方法。将通道注意力机制嵌入改造过的ResNet50网络,提取整个行人的显著特征;利用重新设计的掩码打破原注意力权重,混淆关注区域,降低行人再识别模型的识别能力;联合对抗三元组损失和对抗ID损失监督网络训练,得到行人图像匹配对错误排序,更适用行人再识别中对抗攻击的排序问题。在Market-1501和DukeMTMC-reID数据集上模拟攻击,实验结果表明,该方法能将主流行人再识别系统的Rank-1和平均精度均值(mAP)降低至0.1%,为设计行人再识别防御方法提高鲁棒性提供新启示。 展开更多
关键词 行人再识别 对抗攻击 掩码 注意力机制 注意力 排序损失 鲁棒性
在线阅读 下载PDF
基于Deeplab V3 Plus的自适应注意力机制图像分割算法 被引量:14
5
作者 杨贞 彭小宝 +1 位作者 朱强强 殷志坚 《计算机应用》 CSCD 北大核心 2022年第1期230-238,共9页
针对Deeplab V3 Plus在下采样操作中图像细节信息和小目标信息过早丢失的问题,提出了一种基于Deeplab V3 Plus网络架构的自适应注意力机制图像语义分割算法。首先,在Deeplab V3 Plus主干网络的输入层、中间层和输出层均嵌入注意力机制模... 针对Deeplab V3 Plus在下采样操作中图像细节信息和小目标信息过早丢失的问题,提出了一种基于Deeplab V3 Plus网络架构的自适应注意力机制图像语义分割算法。首先,在Deeplab V3 Plus主干网络的输入层、中间层和输出层均嵌入注意力机制模块,并且引入一个权重值与每个注意力机制模块相乘,以达到约束注意力机制模块的目的;其次,在PASCAL VOC2012公共分割数据集上训练嵌入注意力模块的Deeplab V3 Plus,以此手动获取注意力机制模块权重值(经验值);然后,探索输入层、中间层和输出层中注意力机制模块的多种融合方式;最后,将注意力机制模块的权重值更改为反向传播自动更新,从而得到注意力机制模块的最优权值和最优分割模型。实验结果表明,与原始Deeplab V3 Plus网络结构相比,引入自适应注意力机制的Deeplab V3 Plus网络结构在PASCAL VOC2012公共分割据集和植物虫害数据集上的平均交并比(MIOU)分别提高了1.4个百分点和0.7个百分点。 展开更多
关键词 语义分割 下采样操作 自适应注意力机制 注意力机制模块权重值 DeeplabV3 Plus
在线阅读 下载PDF
融合双重权重机制和图卷积神经网络的微博细粒度情感分类 被引量:2
6
作者 李浩 张兰 +4 位作者 杨兵 杨海潇 寇勇奇 王飞 康雁 《计算机科学》 CSCD 北大核心 2022年第3期246-254,共9页
利用深度学习模型和注意力机制对微博文本进行细粒度情感分类,已成为研究的热点,但是现有注意力机制只考虑单词对单词的影响,对单词本身的多种维度特性(如词义、词性、语义等特征信息)缺乏有效的融合。为了解决这个问题,文中提出了一种... 利用深度学习模型和注意力机制对微博文本进行细粒度情感分类,已成为研究的热点,但是现有注意力机制只考虑单词对单词的影响,对单词本身的多种维度特性(如词义、词性、语义等特征信息)缺乏有效的融合。为了解决这个问题,文中提出了一种双重权重机制WDWM(Word and Dimension Weight Mechanism),并将其与基于解析依赖树的GCN模型相结合,通过选择每条微博中含有关键信息的单词,来抽取单词的重要维度特性,对单词的多种维度特性进行有效融合,从而捕获更加丰富的特征信息。在针对微博细粒度情感分类的实验中,融合双重权重机制和图卷积神经网络的微博细粒度情感分类模型(WDWM-GCN)的F测度达到了84.02%,比2020年提出的最新的算法高出1.7%,这进一步证明,WDWM-GCN能对单词的多维度特性进行有效的融合,能够捕获丰富的特征信息。在对搜狗新闻数据集进行分类的实验中,BERT模型在加入WDWM后,其分类效果得到了进一步提升,这充分证明WDWM对所提分类模型有明显的改进效果。 展开更多
关键词 细粒度情感分类 机制 注意力机制 图卷积神经网络
在线阅读 下载PDF
基于Vision Transformer的车辆重识别模型优化
7
作者 张震 张亚斌 田鸿朋 《郑州大学学报(理学版)》 CAS 北大核心 2025年第1期46-52,共7页
针对车辆重识别任务中样本类内差异性大和类间相似度高的问题,提出了一种Vision Transformer框架下的车辆重识别方法。设计一种关键区域选择模块,整合Transformer中注意力分数矩阵,加强车辆的具有辨别性区域的关注程度,减小局部区域过... 针对车辆重识别任务中样本类内差异性大和类间相似度高的问题,提出了一种Vision Transformer框架下的车辆重识别方法。设计一种关键区域选择模块,整合Transformer中注意力分数矩阵,加强车辆的具有辨别性区域的关注程度,减小局部区域过度集中的注意力权重;构建一种包含对比损失和中心损失的混合损失函数,对比损失函数的引入增强了模型捕捉和比较样本之间的差异的能力,中心损失使得同一类别的样本更加紧密地聚集在一起,增强类间样本的区分度。实验结果验证了其有效性。 展开更多
关键词 车辆识别 注意力机制 注意力 区域选择
在线阅读 下载PDF
基于出行模式的注意力机制可解释性探索
8
作者 翁小雄 田丹 +1 位作者 覃镇林 罗瑞发 《计算机工程与应用》 CSCD 北大核心 2022年第24期284-290,共7页
为了探索深度注意力模型在地铁出行预测任务中的可解释性,提出基于出行模式的注意力权重擦除方法和可解释性评估框架。利用提出的地铁出行深度注意力框架搭建预测模型,使用广州地铁羊城通数据构造三种不同长度出行序列数据集进行模型训... 为了探索深度注意力模型在地铁出行预测任务中的可解释性,提出基于出行模式的注意力权重擦除方法和可解释性评估框架。利用提出的地铁出行深度注意力框架搭建预测模型,使用广州地铁羊城通数据构造三种不同长度出行序列数据集进行模型训练和验证,达到70%以上准确率;通过单一出行模式的注意力权重擦除实验发现,擦除最大注意力权重的出行模式比随机模式更能显著地影响模型预测结果,但大多数样本不发生预测结果的变化。即注意力机制在该条件下提供的可解释性信息是有限的,且该信息量随着序列长度增加而减小;通过一组出行模式注意力权重擦除实验结果表明,按注意力权重降序擦除能最快使模型预测结果发生变化,并且模型能稳定地对重要的出行模式的出行记录分配注意力权重,即注意力机制在该条件下较好地提供了可解释性信息,且该信息量随着序列长度增加而增大。 展开更多
关键词 地铁出行预测 出行模式 注意力机制 注意力擦除 可解释性
在线阅读 下载PDF
基于多尺度自适应注意力的图像超分辨率网络 被引量:3
9
作者 周颖 裴盛虎 +1 位作者 陈海永 许士博 《光学精密工程》 EI CAS CSCD 北大核心 2024年第6期843-856,共14页
针对大多数图像超分辨率重建方法利用单尺度卷积进行特征提取,导致特征提取不充分的问题,提出基于多尺度自适应注意力的图像超分辨率网络。为充分利用各个层次特征中的上下文信息,设计了多尺度特征融合块,其基本单元由自适应双尺度块、... 针对大多数图像超分辨率重建方法利用单尺度卷积进行特征提取,导致特征提取不充分的问题,提出基于多尺度自适应注意力的图像超分辨率网络。为充分利用各个层次特征中的上下文信息,设计了多尺度特征融合块,其基本单元由自适应双尺度块、多路径渐进式交互块和自适应双维度注意力依次串联组成。首先,自适应双尺度块自主融合两个尺度的特征,获得了更丰富的上下文特征;其次,多路径渐进式交互块以渐进的方式交互自适应双尺度块的输出特征,提高了上下文特征之间的关联性;最后,自适应双维度注意力自主选择不同维度注意力细化输出特征后,提高了输出特征的鉴别力。实验结果表明,在Set5,Set14,BSD100和Urban100测试集上,本文方法在PSNR和SSIM定量指标上相比于其他主流方法相均有提升,尤其对于纹理细节难以恢复的Urban100测试集,本文方法在比例因子为×4时,相较于现有最优方法SwinIR,PSNR和SSIM指标分别提升了0.05 dB和0.0045;在视觉效果方面,本文的重建图像具有更多的纹理细节。 展开更多
关键词 超分辨率 多尺度特征 注意力机制 自适应 渐进式信息交互
在线阅读 下载PDF
基于因果推断的图注意力网络 被引量:3
10
作者 张涛 程毅飞 孙欣煦 《计算机科学》 CSCD 北大核心 2023年第S01期147-155,共9页
图注意力网络(Graph Attention Network,GAT)是一种重要的图神经网络,在分类任务中有着广泛的应用。但是当图中邻域节点受到干扰时,模型分类准确度会受影响而降低。对此,提出一种基于因果推断的图注意力网络(Causal Graph Attention Net... 图注意力网络(Graph Attention Network,GAT)是一种重要的图神经网络,在分类任务中有着广泛的应用。但是当图中邻域节点受到干扰时,模型分类准确度会受影响而降低。对此,提出一种基于因果推断的图注意力网络(Causal Graph Attention Network,C-GAT)以提升网络的鲁棒性。该模型首先计算目标节点的邻域与其标签之间的因果权重,并以此对邻域进行因果采样;然后计算采样后邻域与目标节点之间的注意力系数;最后根据注意力系数对邻域信息进行加权聚合,获得目标节点的嵌入特征。在Cora,Pubmed和Citeseer数据集上的实验结果表明,在无扰动的情况下,C-GAT的分类性能与经典模型持平;在有扰动的情况下,相比于经典模型,C-GAT的分类准确度至少提升了6%,在鲁棒性和时间成本上有着较好的平衡。 展开更多
关键词 注意力网络 因果推断 注意力机制 因果
在线阅读 下载PDF
一种基于词级权重的Transformer模型改进方法 被引量:14
11
作者 王明申 牛斌 马利 《小型微型计算机系统》 CSCD 北大核心 2019年第4期744-748,共5页
Google Brain提出了一种用于神经机器翻译(NMT)的简单模型Transformer,该模型完全基于注意力机制,避免使用循环神经网路(RNN),解决了RNN无法并行化的问题.本文在Transformer模型的基础上提出了基于词级权重(Word-Level Weights)的模型... Google Brain提出了一种用于神经机器翻译(NMT)的简单模型Transformer,该模型完全基于注意力机制,避免使用循环神经网路(RNN),解决了RNN无法并行化的问题.本文在Transformer模型的基础上提出了基于词级权重(Word-Level Weights)的模型改进方法,即根据不同单词在句子中的重要性通过神经网络自学习所获得相应的权重,将此权重与Transformer模型相结合.该方法提高了Transformer模型的稳定性和准确性,并在IWSLT16翻译任务中提高了模型的BLEU得分. 展开更多
关键词 神经机器翻译 注意力机制 Transformer模型 词级
在线阅读 下载PDF
基于Graph-LSTMs的双重位置感知方面级情感分类 被引量:2
12
作者 杨锐 刘永坚 +1 位作者 解庆 刘平峰 《计算机应用与软件》 北大核心 2024年第4期165-172,共8页
目前针对用户评论中方面词项情感分类任务的研究大多忽略了依存句法信息,或并未建立依存句法结构与单词之间的联系。为此,提出一种基于Graph-LSTMs的双重位置感知方面级情感分类方法。通过Graph-LSTMs学习词项的上下文语境特征;在双向GR... 目前针对用户评论中方面词项情感分类任务的研究大多忽略了依存句法信息,或并未建立依存句法结构与单词之间的联系。为此,提出一种基于Graph-LSTMs的双重位置感知方面级情感分类方法。通过Graph-LSTMs学习词项的上下文语境特征;在双向GRU的输入中拼接具有双重位置信息的位置向量,优化句子情感编码;利用注意力机制捕获关键的情感特征,实现分类。在SemEval2014的两个数据集上的实验结果表明,该模型相比几种基线模型在准确率和Macro-F1这两个指标上提升明显。 展开更多
关键词 方面级情感分析 Graph-LSTMs 依存句法 位置 注意力机制
在线阅读 下载PDF
基于多尺度边框融合的实体语义增强方法
13
作者 吴灿 陈艳平 +2 位作者 扈应 黄瑞章 秦永彬 《计算机研究与发展》 北大核心 2025年第12期2983-2992,共10页
命名实体识别(named entity recognition,NER)是自然语言处理中的一项传统任务.基于跨度分类的方法是用来解决嵌套命名实体识别的主流方法.该方法通常是拼接实体边界的表示来获得跨度.然而,长实体容易导致2个实体边界之间的语义关联被弱... 命名实体识别(named entity recognition,NER)是自然语言处理中的一项传统任务.基于跨度分类的方法是用来解决嵌套命名实体识别的主流方法.该方法通常是拼接实体边界的表示来获得跨度.然而,长实体容易导致2个实体边界之间的语义关联被弱化,并且单一尺度的跨度无法完整地捕捉实体在不同上下文中的表现.对此提出了一种基于多尺度边框融合的实体语义增强方法.该方法将跨度表示为带有边界位置信息的边框.首先,将通过融合不同尺度实体特征得到多尺度边框以增强边框中的语义特征,使边框的上下文依赖性更强.然后,通过基于位置权重的注意力机制进一步细化边框的边界位置使得边框信息更准确.最后,同时预测边框的实体类别和相对于真实实体的位置偏移量,有效支持嵌套命名实体的识别和定位.该方法在ACE2004英文数据集、ACE2005英文数据集和Weibo中文数据集上分别取得了88.63%,88.53%,73.86%的F1值,证明了模型的有效性. 展开更多
关键词 命名实体识别 跨度分类 多尺度边框融合 实体语义增强 位置注意力机制
在线阅读 下载PDF
基于双流特征融合的配电房异常入侵检测研究
14
作者 郑洋斌 侯北平 +1 位作者 邵方坤 曹志文 《现代电子技术》 北大核心 2025年第19期84-91,共8页
针对常规入侵检测方法在配电站房的应用中由于视角变化、运动模糊、遮挡等导致的漏检和误检问题,文中提出一种双流二阶段融合的异常入侵检测方法。该方法构建了轻量级的双流网络通道用于表征图像和光流图像的特征提取;采用的双流二阶段... 针对常规入侵检测方法在配电站房的应用中由于视角变化、运动模糊、遮挡等导致的漏检和误检问题,文中提出一种双流二阶段融合的异常入侵检测方法。该方法构建了轻量级的双流网络通道用于表征图像和光流图像的特征提取;采用的双流二阶段融合策略实现了两种特征的有效融合。在监控数据集上进行了实验验证并应用于配电站房的场景检测中,检测精度优于YOLOv8n基准模型。实验结果表明,该模型具有较高的泛化能力,能够减少数据的重复采集与标注,并能优化模型训练与部署,具有实际应用价值。 展开更多
关键词 配电站房视频分析 目标检测 注意力机制 双流网络 自适应 复杂场景 YOLOv8n CBAM
在线阅读 下载PDF
基于HGTC−YOLOv8n模型的煤矸识别算法研究 被引量:6
15
作者 滕文想 王成 费树辉 《工矿自动化》 CSCD 北大核心 2024年第5期52-59,共8页
现有基于深度学习的煤矸识别方法在煤矿井下低照度、高噪声及运动模糊等复杂工况下存在煤矸识别精度低、小目标煤矸容易漏检、模型参数量和运算量大,难以部署到计算资源有限的设备中等问题,提出了一种基于HGTC−YOLOv8n模型的煤矸识别算... 现有基于深度学习的煤矸识别方法在煤矿井下低照度、高噪声及运动模糊等复杂工况下存在煤矸识别精度低、小目标煤矸容易漏检、模型参数量和运算量大,难以部署到计算资源有限的设备中等问题,提出了一种基于HGTC−YOLOv8n模型的煤矸识别算法。采用HGNetv2网络替换YOLOv8n的主干网络,通过多尺度特征的有效提取,提高煤矸识别效果并减少模型的存储需求和计算资源消耗;在主干网络中嵌入三重注意力机制模块Triplet Attention,捕获不同维度间的交互信息,增强煤矸图像目标特征的提取,减少无关信息的干扰;选用内容感知特征重组模块(CARAFE)来改进YOLOv8n颈部特征融合网络上采样算子,利用上下文信息提高感受视野,提高小目标煤矸识别准确率。实验结果表明:①HGTC−YOLOv8n模型的平均精度均值为93.5%,模型的参数量为2.645×10^(6),浮点运算量为8.0×10^(9),帧速率为79.36帧/s。②平均精度均值较YOLOv8n模型提升了2.5%,参数量和浮点运算量较YOLOv8n模型分别下降了16.22%和10.11%。③与YOLO系列模型相比,HGTC−YOLOv8n模型的平均精度均值最高,且参数量和浮点运算量最少,检测速度较快,综合检测性能最佳。④基于HGTC−YOLOv8n模型的煤矸识别算法在煤矿井下复杂工况下,改善了煤矸识别精度低、小目标煤矸容易漏检等问题,满足煤矸图像实时检测要求。 展开更多
关键词 煤矸识别 小目标识别 YOLOv8n 内容感知特征模块 注意力机制 Triplet Attention HGNetv2
在线阅读 下载PDF
基于标签相关性学习网络的多标签图像分类方法
16
作者 王路芳 张海云 《太原理工大学学报》 CAS 北大核心 2024年第6期1097-1106,共10页
【目的】针对多标签图像分类任务中的标签特征混乱和标签关系局限性问题,提出了一种基于标签相关性学习网络的多标签图像分类方法(MLLCLN)。【方法】采用掩码注意力方法和多头自注意力机制。在掩码注意力方法中,通过图像真实标签对应的... 【目的】针对多标签图像分类任务中的标签特征混乱和标签关系局限性问题,提出了一种基于标签相关性学习网络的多标签图像分类方法(MLLCLN)。【方法】采用掩码注意力方法和多头自注意力机制。在掩码注意力方法中,通过图像真实标签对应的状态词向量遮盖注意力机制产生的标签特征,使模型能获得更多上下文信息,一定程度上避免了注意力机制的注意力区域重叠的问题。设计了标签相关性学习网络,该网络是由多层多头注意力机制和图神经网络组成。多头自注意力机制能够基于标签特征学习局部标签关系,而图神经网络使用了现有的方法MLGCN作为引导,使模型能同时考虑全局标签关系,缓解了由于标签关系局限性导致的模型出现虚假预测的问题。【结果】MLLCLN在公开数据集MSCOCO2014和VOC2007上的实验结果表明了其较好的性能,分类精度分别达到了84.4%和96.0%,为多标签图像分类提供了新思路。 展开更多
关键词 多头自注意力机制 多标签图像分类 注意力机制 自适应 卷积神经网络
在线阅读 下载PDF
融合功能性副语言比例系数的语音情感识别
17
作者 孙颖 周雅茹 张雪英 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第1期40-48,共9页
语言中的非言语发声如笑声、叹息、抽泣等,称为功能性副语言,对情感表达起重要作用,但现有研究很少考虑多种功能性副语言在一种情感中的协同作用.针对该问题,提出了融合功能性副语言比例系数(functional paralanguage proportion coeffi... 语言中的非言语发声如笑声、叹息、抽泣等,称为功能性副语言,对情感表达起重要作用,但现有研究很少考虑多种功能性副语言在一种情感中的协同作用.针对该问题,提出了融合功能性副语言比例系数(functional paralanguage proportion coefficient,FPPC)的情感识别系统.首先,提取能体现多种功能性副语言在情感语句中出现的频率快慢和持续时间长短的FPPC特征;然后,搭建基于注意力机制的集成学习(attention stacking)为不同的基分类器赋予不同权重,并对FPPC特征进行训练;最后,通过自适应熵权重决策融合方法将传统语音情感识别与基于FPPC特征情感识别进行融合.实验结果显示,融合了FPPC特征后的情感识别结果提高了16.84%,证明融合FPPC特征能有效提高系统整体识别率. 展开更多
关键词 语音情感识别 比例系数 功能性副语言 注意力机制 自适应熵决策融合
在线阅读 下载PDF
基于DeepSORT算法的肉牛多目标跟踪方法 被引量:32
18
作者 张宏鸣 汪润 +3 位作者 董佩杰 孙红光 李书琴 王红艳 《农业机械学报》 EI CAS CSCD 北大核心 2021年第4期248-256,共9页
肉牛的运动行为反映其健康状况,在实际养殖环境下如何识别肉牛并对其进行跟踪,对感知肉牛的运动行为至关重要。基于YOLO v3改进算法(LSRCEM-YOLO),利用视频监控实现了实际养殖环境下的肉牛实时跟踪。该方法采用MobileNet v2作为目标检... 肉牛的运动行为反映其健康状况,在实际养殖环境下如何识别肉牛并对其进行跟踪,对感知肉牛的运动行为至关重要。基于YOLO v3改进算法(LSRCEM-YOLO),利用视频监控实现了实际养殖环境下的肉牛实时跟踪。该方法采用MobileNet v2作为目标检测骨干网络,根据肉牛分布不均、目标尺度变化较大的特点,提出通过添加长短距离语义增强模块(LSRCEM)进行多尺度融合,结合Mudeep重识别模型实现了肉牛多目标跟踪。结果表明:在目标检测方面,LSRCEM-YOLO的m AP值达到了92.3%,模型参数量仅为YOLO v3的10%,相比YOLO v3-tiny也降低了31.34%;在肉牛重识别方面,采用基于调整感受野的Mudeep模型,获得了更多的多尺度特征,其Rank-1指标达到了96.5%;多目标跟踪的多目标跟踪准确率相对于Deep SORT算法从32.3%提高到了45.2%,ID switch次数降低了69.2%。本文方法可为实际环境下的肉牛行为实时跟踪、行为感知提供技术参考。 展开更多
关键词 肉牛 多目标跟踪 目标检测 识别 注意力机制 长短距离语义增强模块
在线阅读 下载PDF
基于改进D-LinkNet模型的高分遥感影像道路提取研究 被引量:15
19
作者 张立恒 王浩 +2 位作者 薛博维 何立明 吕悦 《计算机工程》 CAS CSCD 北大核心 2021年第9期288-296,共9页
针对高分影像中的道路信息易受植被阴影、高楼建筑物、河流等非道路信息干扰的问题,提出一种高分遥感影像道路提取模型。在中心区域引入channel-spatial双注意力机制捕获道路信息的全局特征依赖,并基于原始模型DICE+BCE损失函数,构建新... 针对高分影像中的道路信息易受植被阴影、高楼建筑物、河流等非道路信息干扰的问题,提出一种高分遥感影像道路提取模型。在中心区域引入channel-spatial双注意力机制捕获道路信息的全局特征依赖,并基于原始模型DICE+BCE损失函数,构建新型的超参数权重损失来优化网络模型中参数迭代的误差,改善道路分割的精度。按照1∶1、2∶1、3∶1、4∶1、5∶1这5种比值设定超参数权重比,通过调节超参数权值比获取模型最佳的道路分割性能。实验结果表明,与FCN-8s、U-Net等模型相比,改进D-LinkNet模型道路分割效果明显提升,能有效地规避因非道路因素对道路提取干扰而导致的“虚检”“漏检”“误检”的现象。 展开更多
关键词 高分遥感影像 注意力机制 全局特征依赖 超参数损失 道路分割
在线阅读 下载PDF
基于Sophon SC5+芯片构架的行人搜索算法与优化 被引量:3
20
作者 孙杰 吴绍鑫 +1 位作者 王学军 华璟 《计算机应用》 CSCD 北大核心 2023年第3期744-751,共8页
传统的基于深度神经网络的行人搜索算法计算量大,在大规模部署时搜索性能低,导致算法在落地应用于硬件和预算有限的终端时面临成本高、速度慢的难题。针对以上问题,提出一种基于Sophon SC5+高性能推理芯片的行人检测与重识别算法,从算... 传统的基于深度神经网络的行人搜索算法计算量大,在大规模部署时搜索性能低,导致算法在落地应用于硬件和预算有限的终端时面临成本高、速度慢的难题。针对以上问题,提出一种基于Sophon SC5+高性能推理芯片的行人检测与重识别算法,从算法到硬件自上而下地优化深度学习的效率。首先,利用轻量化的Ghost模块替换YOLOv5s的主干网络,从而大幅度降低模型的参数和计算量;其次,融入CBAM注意力机制,以增强算法的特征学习能力,并提高检测精度;然后,将中心损失约束和Non-local注意力机制加入行人重识别模块,并结合中心约束三元组损失和附加间隔交叉熵损失优化模型,以提升行人重识别算法性能;最后,基于Sophon SC+量化行人检测模型和行人重识别模型并生成最终的推理模型。在Market-1501与DukeMTMC-ReID数据集上的实验结果表明,相较于YOLOv4-tiny、ACRN、SVDNet等主流算法,行人检测算法与行人重识别算法的平均精度均值(mAP)至少提高了43.8和25.7个百分点。基于Sophon SC5+芯片实现int8量化后,所提算法的mAP虽然减小了1.7个百分点,但模型大小减小了74.4%,能够在大规模、城市级行人搜索系统中落地使用。 展开更多
关键词 行人识别 行人搜索 Ghost模块 中心损失 Sophon SC5+ 注意力机制
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部