期刊文献+
共找到107篇文章
< 1 2 6 >
每页显示 20 50 100
一种基于注意力机制的BERT-CNN-GRU检测方法 被引量:1
1
作者 郑雅洲 刘万平 黄东 《计算机工程》 北大核心 2025年第1期258-268,共11页
针对现有检测方法对短域名检测性能普遍较差的问题,提出一种BERT-CNN-GRU结合注意力机制的检测方法。通过BERT提取域名的有效特征和字符间组成逻辑,根据并行的融合简化注意力的卷积神经网络(CNN)和基于多头注意力机制的门控循环单元(GRU... 针对现有检测方法对短域名检测性能普遍较差的问题,提出一种BERT-CNN-GRU结合注意力机制的检测方法。通过BERT提取域名的有效特征和字符间组成逻辑,根据并行的融合简化注意力的卷积神经网络(CNN)和基于多头注意力机制的门控循环单元(GRU)提取域名深度特征。CNN使用n-gram排布的方式提取不同层次的域名信息,并采用批标准化(BN)对卷积结果进行优化。GRU能够更好地获取前后域名的组成差异,多头注意力机制在捕获域名内部的组成关系方面表现出色。将并行检测网络输出的结果进行拼接,最大限度地发挥两种网络的优势,并采用局部损失函数聚焦域名分类问题,提高分类性能。实验结果表明,该方法在二分类上达到了最优效果,在短域名多分类数据集上15分类的加权F1值达到了86.21%,比BiLSTM-Seq-Attention模型提高了0.88百分点,在UMUDGA数据集上50分类的加权F1值达到了85.51%,比BiLSTM-Seq-Attention模型提高了0.45百分点。此外,该模型对变体域名和单词域名生成算法(DGA)检测性能较好,具有处理域名数据分布不平衡的能力和更广泛的检测能力。 展开更多
关键词 恶意短域名 BERT预训练 批标准化 注意力机制 门控循环单元 并行卷积神经网络
在线阅读 下载PDF
粤港澳大湾区并发复合灾害敏感性评估
2
作者 徐峥辉 王伟 +1 位作者 宋月 黄莉 《河海大学学报(自然科学版)》 北大核心 2025年第4期99-107,共9页
为精确评估粤港澳大湾区并发复合灾害的敏感性,构建了崩塌滑坡并发复合灾害敏感性评价指标体系,同时建立并推导了考虑并发复合灾害空间维度叠加效应的敏感性评估模型。结果表明:粤港澳大湾区滑坡崩塌并发复合灾害高敏感区在怀集县、封... 为精确评估粤港澳大湾区并发复合灾害的敏感性,构建了崩塌滑坡并发复合灾害敏感性评价指标体系,同时建立并推导了考虑并发复合灾害空间维度叠加效应的敏感性评估模型。结果表明:粤港澳大湾区滑坡崩塌并发复合灾害高敏感区在怀集县、封开县等湾区西北部地区和龙岗区、惠城区等湾区东北部地区集中分布,低敏感区在三水区、南海区等湾区中部地区和台山市、恩平市等湾区西南部地区集中分布,较高敏感区、中敏感区、较低敏感区主要作为过渡区零星散布于高、低敏感区之间。 展开更多
关键词 并发复合灾害 敏感性 滑坡崩塌 评估模型 卷积神经网络 粤港澳大湾区
在线阅读 下载PDF
面向可重构阵列的CNN多维融合数据复用方法
3
作者 张骁帆 蒋林 +1 位作者 李远成 盛明威 《计算机应用研究》 北大核心 2025年第6期1801-1806,共6页
可重构阵列结构具有通用处理器的灵活性和专用硬件的高能效,已经成为应对卷积神经网络(CNN)等计算密集和访存密集型应用的最佳选择之一。然而,随着计算量的不断增加,访存开销持续上升,严重限制了计算效率的进一步提升。因此,提出一种面... 可重构阵列结构具有通用处理器的灵活性和专用硬件的高能效,已经成为应对卷积神经网络(CNN)等计算密集和访存密集型应用的最佳选择之一。然而,随着计算量的不断增加,访存开销持续上升,严重限制了计算效率的进一步提升。因此,提出一种面向可重构阵列的CNN多维融合的数据复用新方法。通过计算单元内数据循环调用、不同计算单元间数据脉动传输的策略,在计算单元和阵列两个维度复用数据。同时,通过阵列的重构进行任务切换,实现多维融合的数据复用,并在Virtex UltraScale 440开发板上对所提方法进行了实验验证。结果表明,相比于现有的基于现场可编程门阵列(FPGA)的CNN实现方法,所提方法可使访存次数最高减少69.4%,运算速度提升16.2%以上,处理单元利用率达94.1%。说明该方法能够在可重构阵列实现CNN的高效数据复用,进而达到硬件加速的目的。 展开更多
关键词 卷积神经网络 可重构结构 数据复用 并行加速
在线阅读 下载PDF
基于Zynq的卷积神经网络加速器设计
4
作者 孟凡开 张峰 +1 位作者 李淼 张多利 《合肥工业大学学报(自然科学版)》 北大核心 2025年第7期904-909,共6页
针对卷积神经网络(convolutional neural network,CNN)嵌入式部署资源开销大、运行速度慢等问题,文章提出一种以Tiny-YOLOv3作为算法模型的CNN硬件加速器。首先,基于Tiny-YOLOv3网络各层的特性和要求设计CNN加速器实现方案,将权重系数... 针对卷积神经网络(convolutional neural network,CNN)嵌入式部署资源开销大、运行速度慢等问题,文章提出一种以Tiny-YOLOv3作为算法模型的CNN硬件加速器。首先,基于Tiny-YOLOv3网络各层的特性和要求设计CNN加速器实现方案,将权重系数按位分割,面向单bit权重设计卷积加速器,通过逐位实施达到处理速度和识别率的高效平衡;然后,采用查表选择法实现卷积算子的乘加运算,设计一款6×3×16的三维加速器计算阵列,可单周期完成288个卷积窗口计算;最后,在Xilinx Zynq UltraScale+MPSoC系列芯片上对设计的CNN加速器进行性能测试。实验结果表明,该CNN加速器在200 MHz频率下具有518.4 GOPS的算力,比现有的解决方案性能提高了约63%。 展开更多
关键词 卷积神经网络(CNN) Tiny-YOLOv3网络模型 硬件加速 流水阵列 并行运算
在线阅读 下载PDF
融合多尺度语义和双分支并行的医学图像分割网络
5
作者 袁宝华 陈佳璐 王欢 《计算机应用》 北大核心 2025年第3期988-995,共8页
在医学图像分割网络中,卷积神经网络(CNN)虽然能提取丰富的局部特征细节,但存在远程信息捕获不足的问题。Transformer虽然可以捕捉长距离的全局特征依赖关系,但是会破坏局部特征细节。为充分利用2种网络特征的互补性,提出一种用于医学... 在医学图像分割网络中,卷积神经网络(CNN)虽然能提取丰富的局部特征细节,但存在远程信息捕获不足的问题。Transformer虽然可以捕捉长距离的全局特征依赖关系,但是会破坏局部特征细节。为充分利用2种网络特征的互补性,提出一种用于医学图像分割的CNN和Transformer并行的融合网络——PFNet。该网络的并行融合模块使用一对基于CNN和Transformer的相互依赖的并行分支来高效地学习局部和全局两方面的辨别特征,并以交互方式交叉融合局部特征和长距离特征的依赖关系;同时,为恢复在下采样期间丢失的空间信息以增强细节的保留,提出多尺度交互(MSI)模块提取分层CNN分支生成的多尺度特征的局部上下文以进行远程依赖关系建模。实验结果表明,PFNet优于MISSFormer(Medical Image Segmentation tranSFormer)和UCTransNet(U-Net with Channel Transformer module)等先进方法。在Synapse和ACDC(Automated Cardiac Diagnosis Challenge)数据集上,相较于最优的基线方法MISSFormer,PFNet的平均Dice相似系数(DSC)分别提高1.27%和0.81%。可见,PFNet能实现更精准的医学图像分割。 展开更多
关键词 医学图像分割 TRANSFORMER 卷积神经网络 并行融合 多尺度交互
在线阅读 下载PDF
基于GPU的Winograd卷积算法并行化
6
作者 王鑫 甄雪茹 《计算机应用研究》 北大核心 2025年第8期2446-2451,共6页
针对现代卷积神经网络中计算负荷过重的问题,提出一种基于GPU的创新性Winograd并行卷积算法。该算法利用负载均衡的任务映射、优化数据加载策略以隐藏延迟,并结合动态填充方法,充分挖掘Winograd卷积算法与GPU架构的协同效应。实验结果表... 针对现代卷积神经网络中计算负荷过重的问题,提出一种基于GPU的创新性Winograd并行卷积算法。该算法利用负载均衡的任务映射、优化数据加载策略以隐藏延迟,并结合动态填充方法,充分挖掘Winograd卷积算法与GPU架构的协同效应。实验结果表明,在经典卷积神经网络模型ResNet的多个卷积层上,提出的算法优于NVIDIA cuDNN 8.3.0库中的标准Winograd卷积算法,在Turing架构的RTX 2080Ti GPU上实现高达2.46的加速比,并且保持较高的计算准确性。与基于GPU的标准Winograd卷积算法相比,该算法显著提升了卷积计算效率。 展开更多
关键词 Winograd算法 并行计算 CUDA 卷积神经网络
在线阅读 下载PDF
RPPM-Net:基于多尺度特征并行融合的图像识别方法
7
作者 刘思远 张文东 +2 位作者 卢润 牛森 马梦楠 《现代电子技术》 北大核心 2025年第15期71-77,共7页
针对传统深度神经网络在图像识别任务中存在的无法有效关注重点区域与特征、感受野较小导致信息退化以及模型泛化能力不足的问题,文中提出一种基于多尺度并行融合的图像识别网络,即残差并行金字塔多尺度注意力网络(RPPM-Net)。首先,设... 针对传统深度神经网络在图像识别任务中存在的无法有效关注重点区域与特征、感受野较小导致信息退化以及模型泛化能力不足的问题,文中提出一种基于多尺度并行融合的图像识别网络,即残差并行金字塔多尺度注意力网络(RPPM-Net)。首先,设计并行注意力网络,通过多头并行的混合注意力机制捕获多样化的特征信息,在保持模型效率的同时,增强网络在识别任务中对重要区域和关键特征的聚焦能力,解决对重点特征关注不足的问题;其次,设计多尺度金字塔卷积注意力模块,通过在不同层级有效集成多尺度特征,解决感受野较小导致的信息退化问题;最后,采用增强型全连接层及正则化技术,有效缓解过拟合问题,提升模型在不同数据集上的泛化能力。实验结果表明,RPPM-Net在CIFAR-10、CIFAR-100、Caltech-256数据集上的准确率分别达到97.02%、85.04%、89.69%,在不显著增加计算成本的前提下,充分结合结构正则化和特征整合,有效地增强了网络的性能。 展开更多
关键词 图像识别 卷积神经网络 多尺度特征 并行注意力 金字塔卷积 特征提取
在线阅读 下载PDF
基于多尺度特征融合预处理与深度稀疏网络的并行磁共振成像重建
8
作者 薛磊 段继忠 《数据采集与处理》 北大核心 2025年第4期1082-1095,共14页
磁共振成像(Magnetic resonance imaging,MRI)在医学诊断中具有关键作用,但过长的扫描时间可能会导致患者不适或产生运动伪影。并行成像技术和压缩感知理论表明,可通过对k空间数据进行欠采样从而提高扫描速度,其中并行MRI是一种通过利... 磁共振成像(Magnetic resonance imaging,MRI)在医学诊断中具有关键作用,但过长的扫描时间可能会导致患者不适或产生运动伪影。并行成像技术和压缩感知理论表明,可通过对k空间数据进行欠采样从而提高扫描速度,其中并行MRI是一种通过利用多个接收线圈同时采集多个数据通道来加速成像过程的技术。深度学习凭借其强大的特征提取和模式识别能力,在欠采样MRI重建中展现出巨大的潜力。为克服现有技术的局限性(如需要自动校准信号、重建不稳定等),提出了一种创新的重建方法,旨在从欠采样的k空间数据中高效、准确地重建高质量的并行磁共振图像。该方法的核心骨架为深度稀疏网络,该网络通过将求解稀疏模型的迭代收缩阈值算法的迭代过程展开,转化为深度神经网络框架内的一系列可训练层。另外,还引入基于多尺度特征融合的自适应预处理模块,通过融合普通卷积与异型卷积核,进一步提升网络的稀疏表示能力。实验结果表明,相较于其他先进方法,本文提出的方法在多个数据集上均表现出更优的重建性能,包括更高的峰值信噪比和结构相似性指数,以及更低的高频误差范数。 展开更多
关键词 并行磁共振成像重建 深度学习 卷积神经网络 深度稀疏网络 多尺度特征融合
在线阅读 下载PDF
基于轻量化多尺度神经网络的ZPW-2000移频信号检测方法
9
作者 武晓春 刘欣然 《中国铁道科学》 EI CAS CSCD 北大核心 2024年第5期187-197,共11页
针对ZPW-2000移频信号在不平衡牵引电流干扰时低频信号难以检测的问题,提出基于卷积注意力模块的轻量化多尺度神经网络的移频信号低频信息检测方法。首先,根据ZPW-2000移频信号的载频范围,使用不同卷积核大小的多尺度层提取相应载频调... 针对ZPW-2000移频信号在不平衡牵引电流干扰时低频信号难以检测的问题,提出基于卷积注意力模块的轻量化多尺度神经网络的移频信号低频信息检测方法。首先,根据ZPW-2000移频信号的载频范围,使用不同卷积核大小的多尺度层提取相应载频调制下的移频信号特征;其次,建立线性倒残差模块实现网络轻量化,在保证网络检测准确率的同时减少网络参数,缩短网络检测时长;最后,引入卷积注意力模块,标定通道和空间特征权重,提升网络性能,通过全连接层进行分类,输出18种低频信号的概率分布。结果表明:将含有工频谐波干扰等5类噪声的移频信号输入低频检测模型中进行检测,平均准确率可达99.22%,召回率达到99.21%,综合评价指标值为0.992,检测时间不超过0.249 s。该方法检测效果更优,具有良好的抗干扰能力,可为带内噪声干扰条件下检测ZPW-2000移频信号的低频信息提供重要参考。 展开更多
关键词 轻量化卷积神经网络 谐波干扰 多尺度神经网络 信号检测 ZPW-2000移频信号
在线阅读 下载PDF
基于GADF-CWT-GCNN的滚动轴承故障诊断方法研究
10
作者 张小丽 罗鑫 +2 位作者 李敏 梁旺 王芳珍 《西北工业大学学报》 EI CAS CSCD 北大核心 2024年第5期866-874,共9页
针对滚动轴承故障诊断在小样本环境下引起的模型泛化能力差、诊断精度低的问题,提出一种基于格拉姆角分场(GADF)和连续小波变化(continuous wavelet transform,CWT)与并行二维组归一化卷积神经网络(parallel convolutional neural netwo... 针对滚动轴承故障诊断在小样本环境下引起的模型泛化能力差、诊断精度低的问题,提出一种基于格拉姆角分场(GADF)和连续小波变化(continuous wavelet transform,CWT)与并行二维组归一化卷积神经网络(parallel convolutional neural network,P2D-GCNN)的滚动轴承故障诊断方法。对采集的数据进行预处理,采用格拉姆角场和连续小波变换将一维振动信号转换成二维图像作为模型输入,再选用数据增强技术扩充样本子图,满足网络输入要求,并将其导入搭建的组归一化卷积神经网络中进行诊断检测。结果表明:文中数据处理方法与搭建模型在小样本环境下泛化能力远高于SVM和1D-CNN等其他网络模型。为进一步验证模型在小样本数据下的识别能力,取数据集的70%,40%和20%样本量进行多次实验,所对应的训练准确率及测试准确率分为99.38%,99.02%,99.47%,98.29%,99.05%,97.08%。结果证明,文中模型在小样本环境下对轴承故障诊断具有很高的准确率。 展开更多
关键词 滚动轴承 故障诊断 格拉姆角分场(GADF) 小波变换(CWT) 并行二维卷积神经网络(P2D-GCNN)
在线阅读 下载PDF
并联卷积神经网络的近红外光谱定量分析模型 被引量:3
11
作者 于水 宦克为 +1 位作者 刘小溪 王磊 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2024年第6期1627-1635,共9页
近红外光谱分析已成为工农业生产过程质量监控领域中不可或缺的重要分析手段之一,在食品、农业、医药等定性定量分析领域被广泛应用。预测精度高、运行速度快、泛化能力强的近红外光谱预测模型可用于不同物质的定性定量分析。但由于近... 近红外光谱分析已成为工农业生产过程质量监控领域中不可或缺的重要分析手段之一,在食品、农业、医药等定性定量分析领域被广泛应用。预测精度高、运行速度快、泛化能力强的近红外光谱预测模型可用于不同物质的定性定量分析。但由于近红外光谱数据量的激增,传统的近红外光谱建模方法已经出现明显的不足。随着人工智能技术的不断发展,深度学习算法在近红外光谱分析领域得到了广泛应用。提出了一种基于并联卷积神经网络的近红外光谱定量分析模型(PaBATunNet)。该模型由1个一维卷积层、1个并联卷积模块(Module)、1个展平层、4个全连接层和1个参数调节器(PR)组成,Module模块包括5个子模块分别对光谱数据进行线性及非线性多维特征提取,并通过Concatenate函数将提取后的光谱特征数据进行拼接,PR模块通过调节优化PaBATunNet模型参数,提高模型预测精度。基于Gard-CAM思想给出了PaBATunNet模型高贡献度特征波长,增加了PaBATunNet模型的可解释性。以谷物、柴油、啤酒、牛奶四组公开的近红外光谱数据为例,将PaBATunNet模型的预测结果与偏最小二乘(PLS)、主成分回归(PCR)、支持向量机(SVM)和BP神经网络(BP)模型的预测结果进行比较。结果表明,与PLS相比,PaBATunNet模型在谷物、柴油、啤酒、牛奶数据集的预测精度上分别提高了30.0%、40.7%、43.0%、52.8%;与PCR相比,PaBATunNet模型的预测精度分别提高了28.8%、35.9%、40.8%、52.2%;与SVM相比,PaBATunNet模型的预测精度分别提高了45.5%、37.4%、45.3%、54.7%;与BP相比,PaBATunNet模型的预测精度分别提高了7.9%、32.4%、90.1%、62.0%。基于并联卷积神经网络的近红外光谱建模方法相比于传统建模方法解决了模型预测精度低、运行时间长、泛化能力差以及可解释性不强等问题,可有效应用于工农业生产中不同物质的定量分析,为建立快速、无损、高精度的近红外光谱定量分析模型提供了科学基础。 展开更多
关键词 近红外光谱 深度学习 并联卷积神经网络 定量分析 预测模型
在线阅读 下载PDF
基于三维并行多视野卷积神经网络的脑电信号情感识别 被引量:2
12
作者 韩新龙 高云园 马玉良 《传感技术学报》 CAS CSCD 北大核心 2024年第4期696-703,共8页
利用脑电信号识别情感状态已经成为当前的研究热门。现有的情感识别方法通常提取二维信息作样本,却忽略了包含大脑不同区域重要特征的空间信息。针对这个问题,结合脑电通道间布局和原始脑电信号中的频率相关特征,提出了基于三维并行多... 利用脑电信号识别情感状态已经成为当前的研究热门。现有的情感识别方法通常提取二维信息作样本,却忽略了包含大脑不同区域重要特征的空间信息。针对这个问题,结合脑电通道间布局和原始脑电信号中的频率相关特征,提出了基于三维并行多视野卷积神经网络(Three-dimensional Parallel Multi-field Convolutional Neural Network, TPMCNN)的脑电情感识别新方法。首先将原始脑电信号划分成多频带,并提取每个频带的微分熵(DE)特征。接着将数据按照电极传感器的位置转变成三维特征矩阵。最后采用TPMCNN网络处理所得到的矩阵。实验结果表明,利用不同频带的微分熵特征构造的三维特征矩阵,能够有效地提取多通道脑电信号中与情感识别有关的特征,所提出的并行多视野卷积神经网络能够充分发挥出深度学习的优势。实验在公开数据集DEAP上进行二分类,在唤醒和效价的准确率分别达到了97.31%和96.72%,四分类的准确率达到了97.17%,证实了所提出的方法对脑电信号情感识别的优越性能。 展开更多
关键词 情感识别 三维特征 多视野卷积神经网络 并行网络
在线阅读 下载PDF
基于可重构阵列的CNN数据量化方法 被引量:1
13
作者 朱家扬 蒋林 +2 位作者 李远成 宋佳 刘帅 《计算机应用研究》 CSCD 北大核心 2024年第4期1070-1076,共7页
针对卷积神经网络(CNN)模型中大量卷积操作,导致网络规模大幅增加,从而无法部署到嵌入式硬件平台,以及不同粒度数据与底层硬件结构不协调导致计算效率低的问题,基于项目组开发的可重构阵列处理器,面向支持多种位宽的运算单元,通过软硬... 针对卷积神经网络(CNN)模型中大量卷积操作,导致网络规模大幅增加,从而无法部署到嵌入式硬件平台,以及不同粒度数据与底层硬件结构不协调导致计算效率低的问题,基于项目组开发的可重构阵列处理器,面向支持多种位宽的运算单元,通过软硬件协同和可重构计算方法,采用KL(Kullback-Leibler)散度自定义量化阈值和随机取整进行截断处理的方式,寻找参数定长的最佳基点位置,设计支持多种计算粒度并行操作的指令及其卷积映射方案,并以此实现三种不同位宽的动态数据量化。实验结果表明,将权值与特征图分别量化到8 bit可以在准确率损失2%的情况下将模型压缩为原来的50%左右;将测试图像量化到三种位宽下进行硬件测试的加速比分别达到1.012、1.273和1.556,最高可缩短35.7%的执行时间和降低56.2%的访存次数,同时仅带来不足1%的相对误差,说明该方法可以在三种量化位宽下实现高效率的神经网络计算,进而达到硬件加速和模型压缩的目的。 展开更多
关键词 卷积神经网络 数据量化 可重构结构 并行映射 加速比
在线阅读 下载PDF
结合空洞卷积与注意力机制的道路提取方法 被引量:1
14
作者 余果 李大成 杨毅 《中国空间科学技术(中英文)》 CSCD 北大核心 2024年第5期175-185,共11页
针对高分辨率影像中道路情况复杂,存在细小道路和被建筑、阴影等隔断道路,导致道路提取精度不高的问题,提出一种结合空洞卷积单元和并行注意力机制模块的改进模型AP-LinkNet。该模型是通过在下采样编码过程中扩大感受野和深层次关注道... 针对高分辨率影像中道路情况复杂,存在细小道路和被建筑、阴影等隔断道路,导致道路提取精度不高的问题,提出一种结合空洞卷积单元和并行注意力机制模块的改进模型AP-LinkNet。该模型是通过在下采样编码过程中扩大感受野和深层次关注道路特征以达到更高的细节道路提取精度。其中空洞卷积模块在扩大感受野的同时不改变空间上像素之间的关系,并行注意力机制提高输入影像采样过程中对通道和空间信息的关注度,并加权赋值给解码步骤的反卷积特征。结合两种机制的特点,减少复杂道路背景的噪声扰乱性以及提高道路提取模型的整体精度。与DeepLabV3+、U-Net、LinkNet和D-LinkNet模型做对比分析,AP-LinkNet模型在DeepGlobe数据集上道路提取的F_(1)分数和IOU评价指标为80.69%和78.65%,其中F_(1)分数分别高出对比模型11.71%、5.24%、3.97%和3.58%。结果表明模型精确度和鲁棒性更高,对于高分影像狭窄、被遮挡等复杂道路细节提取效果好。 展开更多
关键词 深度学习 空洞卷积 并行注意力机制 混合损失函数 卷积神经网络
在线阅读 下载PDF
基于多域信息融合的脑电情感识别研究 被引量:1
15
作者 王泽田 张学军 《电子测量技术》 北大核心 2024年第2期168-175,共8页
脑电信号识别方法较少将空间、时间和频率信息相融合,为了充分挖掘脑电信号包含的丰富信息,本文提出一种多域信息融合的脑电情感识别方法。该方法利用二维卷积神经网络和一维卷积神经网络相结合的并行卷积神经网络(PCNN)模型学习脑电信... 脑电信号识别方法较少将空间、时间和频率信息相融合,为了充分挖掘脑电信号包含的丰富信息,本文提出一种多域信息融合的脑电情感识别方法。该方法利用二维卷积神经网络和一维卷积神经网络相结合的并行卷积神经网络(PCNN)模型学习脑电信号的空间、时间和频率特征,来对人类情感状态进行分类。其中,2D-CNN用于挖掘相邻EEG通道间的空间和频率信息,1D-CNN用于挖掘EEG的时间和频率信息。最后,将两个并行卷积模块提取的信息融合进行情感识别。在数据集SEED上的情感三分类实验结果表明,融合空间、时间、频率特征的PCNN整体分类准确率达到了98.04%,与只提取空频信息的2D-CNN和提取时频信息的1D-CNN相比,准确率分别提高了1.97%和0.60%。并于最近的类似工作相比,本文提出的方法对于脑电情感分类具有一定的优越性。 展开更多
关键词 脑电信号 多域信息融合 情感识别 并行卷积神经网络
在线阅读 下载PDF
一种基于CNN与FFT‑ELM的输电线路故障识别与定位方法 被引量:12
16
作者 裴东锋 刘勇 +3 位作者 闫柯柯 郭威 宋福如 田志杰 《电力科学与技术学报》 CAS CSCD 北大核心 2024年第1期164-170,共7页
及时、准确地检测输电线路故障类型与位置是提高电力系统可靠性最重要的问题之一,为此提出一种基于卷积神经网络(convolutional neural networks,CNN)与基于快速傅里叶变换(fast Fourier transform,FFT)的极限学习机(extreme learning m... 及时、准确地检测输电线路故障类型与位置是提高电力系统可靠性最重要的问题之一,为此提出一种基于卷积神经网络(convolutional neural networks,CNN)与基于快速傅里叶变换(fast Fourier transform,FFT)的极限学习机(extreme learning machine,ELM)分类模型并行的输电线路故障识别及定位方法。首先,以故障电压时序图作为输入,构建CNN;然后,利用FFT将时域故障电压数据分解,提取各频段的电压峰值与相角作为故障特征样本;接着,以提取的故障特征样本集作为输入,构建ELM网络;最后,通过特征融合层将2个神经网络进行融合,输出故障类型和定位结果。实验结果表明,此方法对输电线路故障识别的准确率为99.95%、故障定位误差在500 m以内、平均误差为263.5 m,可靠性优于其他模型。 展开更多
关键词 故障识别及定位 输电线路 并行神经网络 卷积神经网络 快速傅里叶变换 极限学习机
在线阅读 下载PDF
基于FPGA的YOLOv5s网络高效卷积加速器设计 被引量:3
17
作者 刘谦 王林林 周文勃 《电讯技术》 北大核心 2024年第3期366-375,共10页
为提升在资源受限情况下的嵌入式平台上卷积神经网络(Convolutional Neural Network,CNN)目标识别的资源利用率和能效,提出了一种适用于YOLOv5s目标识别网络的现场可编程门阵列(Field Programmable Gate Array,FPGA)共享计算单元的并行... 为提升在资源受限情况下的嵌入式平台上卷积神经网络(Convolutional Neural Network,CNN)目标识别的资源利用率和能效,提出了一种适用于YOLOv5s目标识别网络的现场可编程门阵列(Field Programmable Gate Array,FPGA)共享计算单元的并行卷积加速结构,该结构通过共享3×3卷积和1×1卷积的计算单元提高了加速器硬件资源利用率。此外,还利用卷积层BN(Batch Normalization)层融合、模型量化、循环分块以及双缓冲等策略,提高系统计算效率并减少硬件资源开销。实验结果表明,加速器在200 MHz的工作频率下,实现的卷积计算峰值性能可达97.7 GOPS(Giga Operations per Second),其YOLOv5s网络的平均计算性可达78.34 GOPS,与其他FPGA加速器方案相比在DSP效率、能耗比以及整体性能等方面具有一定的提升。 展开更多
关键词 卷积神经网络(CNN) 目标识别 YOLOv5s 并行卷积加速结构
在线阅读 下载PDF
轻量化沥青路面裂缝图像分割网络PIPNet 被引量:2
18
作者 封筠 毕健康 +1 位作者 霍一儒 李家宽 《计算机应用》 CSCD 北大核心 2024年第5期1520-1526,共7页
裂缝分割是对路面病害损坏程度评估的重要前提,为平衡深度神经网络分割的有效性与实时性,提出一种基于U-Net编码-解码结构的轻量化沥青路面裂缝图像分割网络PIPNet(Parallel dilated convolution of Inverted Pyramid Network)。编码部... 裂缝分割是对路面病害损坏程度评估的重要前提,为平衡深度神经网络分割的有效性与实时性,提出一种基于U-Net编码-解码结构的轻量化沥青路面裂缝图像分割网络PIPNet(Parallel dilated convolution of Inverted Pyramid Network)。编码部分为倒金字塔结构,提出了具有不同空洞率的多分支并行空洞卷积模块,结合深度可分离卷积和普通卷积,逐级减少并行卷积的个数,对表层、中层及底层特征提取多尺度信息并降低模型复杂度;同时借鉴GhostNet特点,设计了逆残差轻量化模块,嵌入并行双池化注意力。在GAPs384数据集上的测试结果表明,PIPNet在参数量(Params)和计算量(MFLOPs)仅为ResNet50编码近1/6的情况下,平均交并比(mIoU)提高了1.10个百分点,且较轻量化GhostNet和SegNet分别高出4.14与9.95个百分点。实验结果表明,PIPNet在降低模型复杂度的同时,有着较好的裂缝分割性能,且对不同路面裂缝图像分割适应性良好。 展开更多
关键词 沥青路面图像 裂缝分割 轻量化神经网络 倒金字塔结构 并行空洞卷积
在线阅读 下载PDF
轻量级卷积神经网络的硬件加速方法
19
作者 吕文浩 支小莉 童维勤 《计算机工程与设计》 北大核心 2024年第3期699-706,共8页
为提升轻量级卷积神经网络在硬件平台的资源利用效率和推理速度,基于软硬件协同优化的思想,提出一种面向FPGA平台的轻量级卷积神经网络加速器,并针对网络结构的特性设计专门的硬件架构。与多级并行策略结合,设计一种统一的卷积层计算单... 为提升轻量级卷积神经网络在硬件平台的资源利用效率和推理速度,基于软硬件协同优化的思想,提出一种面向FPGA平台的轻量级卷积神经网络加速器,并针对网络结构的特性设计专门的硬件架构。与多级并行策略结合,设计一种统一的卷积层计算单元。为降低模型存储成本、提高加速器的吞吐量,提出一种基于可微阈值的选择性移位量化方案,使计算单元能够以硬件友好的形式执行计算。实验结果表明,在Arria 10 FPGA平台上部署的MobileNetV2加速器能够达到311 fps的推理速度,相比CPU版本实现了约9.3倍的加速比、GPU版本约3倍的加速比。在吞吐量方面,加速器能够实现98.62 GOPS。 展开更多
关键词 软硬件协同优化 现场可编程门阵列 轻量级卷积神经网络 移位量化 并行计算 硬件加速 开放式计算语言
在线阅读 下载PDF
基于动态可重构结构的卷积数据复用优化设计 被引量:1
20
作者 宋佳 蒋林 +1 位作者 朱育琳 朱家扬 《传感器与微系统》 CSCD 北大核心 2024年第6期105-108,共4页
针对卷积神经网络(CNN)计算效率低、速度慢、硬件资源消耗大等问题,提出了基于动态可重构结构的卷积数据复用优化设计方案。利用可重构阵列邻接互连寄存器实现输入特征图数据和权值数据的复用,提高内存访问效率,采用层间多通道并行计算... 针对卷积神经网络(CNN)计算效率低、速度慢、硬件资源消耗大等问题,提出了基于动态可重构结构的卷积数据复用优化设计方案。利用可重构阵列邻接互连寄存器实现输入特征图数据和权值数据的复用,提高内存访问效率,采用层间多通道并行计算对神经网络卷积运算进行加速。经在AlexNet上测试,论文提出的数据复用策略使得卷积运算乘累加操作最高可减少44.05%。在Zynq—7000开发板上实现本文提出的优化方案。结果表明:相比于现有的基于现场可编程门阵列(FPGA)实现AlexNet的计算,本实验LUTs资源消耗减少12.86%、FF资源消耗减少约97.5%、DSP资源消耗减少约66.7%。 展开更多
关键词 卷积神经网络 并行计算 数据复用
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部