期刊文献+
共找到64篇文章
< 1 2 4 >
每页显示 20 50 100
基于并行计算的计算智能综述
1
作者 吴菲 陈嘉诚 王万良 《浙江大学学报(工学版)》 北大核心 2025年第1期27-38,共12页
传统计算智能技术缺乏实时性和适应性,基于并行计算的计算智能技术能够提高计算效率,解决多模态信息兼容处理的问题.分别从智能计算的3个分支(神经网络、进化算法和群智能算法)介绍计算智能与大数据并行计算融合的研究现状.总结并行计... 传统计算智能技术缺乏实时性和适应性,基于并行计算的计算智能技术能够提高计算效率,解决多模态信息兼容处理的问题.分别从智能计算的3个分支(神经网络、进化算法和群智能算法)介绍计算智能与大数据并行计算融合的研究现状.总结并行计算智能面临的问题与挑战,思考相关研究的发展方向. 展开更多
关键词 并行计算 计算智能 神经网络 进化算法 群智能
在线阅读 下载PDF
基于GPU的Winograd卷积算法并行化
2
作者 王鑫 甄雪茹 《计算机应用研究》 北大核心 2025年第8期2446-2451,共6页
针对现代卷积神经网络中计算负荷过重的问题,提出一种基于GPU的创新性Winograd并行卷积算法。该算法利用负载均衡的任务映射、优化数据加载策略以隐藏延迟,并结合动态填充方法,充分挖掘Winograd卷积算法与GPU架构的协同效应。实验结果表... 针对现代卷积神经网络中计算负荷过重的问题,提出一种基于GPU的创新性Winograd并行卷积算法。该算法利用负载均衡的任务映射、优化数据加载策略以隐藏延迟,并结合动态填充方法,充分挖掘Winograd卷积算法与GPU架构的协同效应。实验结果表明,在经典卷积神经网络模型ResNet的多个卷积层上,提出的算法优于NVIDIA cuDNN 8.3.0库中的标准Winograd卷积算法,在Turing架构的RTX 2080Ti GPU上实现高达2.46的加速比,并且保持较高的计算准确性。与基于GPU的标准Winograd卷积算法相比,该算法显著提升了卷积计算效率。 展开更多
关键词 Winograd算法 并行计算 CUDA 卷积神经网络
在线阅读 下载PDF
基于轻量化多尺度神经网络的ZPW-2000移频信号检测方法
3
作者 武晓春 刘欣然 《中国铁道科学》 EI CAS CSCD 北大核心 2024年第5期187-197,共11页
针对ZPW-2000移频信号在不平衡牵引电流干扰时低频信号难以检测的问题,提出基于卷积注意力模块的轻量化多尺度神经网络的移频信号低频信息检测方法。首先,根据ZPW-2000移频信号的载频范围,使用不同卷积核大小的多尺度层提取相应载频调... 针对ZPW-2000移频信号在不平衡牵引电流干扰时低频信号难以检测的问题,提出基于卷积注意力模块的轻量化多尺度神经网络的移频信号低频信息检测方法。首先,根据ZPW-2000移频信号的载频范围,使用不同卷积核大小的多尺度层提取相应载频调制下的移频信号特征;其次,建立线性倒残差模块实现网络轻量化,在保证网络检测准确率的同时减少网络参数,缩短网络检测时长;最后,引入卷积注意力模块,标定通道和空间特征权重,提升网络性能,通过全连接层进行分类,输出18种低频信号的概率分布。结果表明:将含有工频谐波干扰等5类噪声的移频信号输入低频检测模型中进行检测,平均准确率可达99.22%,召回率达到99.21%,综合评价指标值为0.992,检测时间不超过0.249 s。该方法检测效果更优,具有良好的抗干扰能力,可为带内噪声干扰条件下检测ZPW-2000移频信号的低频信息提供重要参考。 展开更多
关键词 轻量化卷积神经网络 谐波干扰 多尺度神经网络 信号检测 ZPW-2000移频信号
在线阅读 下载PDF
轻量级卷积神经网络的硬件加速方法
4
作者 吕文浩 支小莉 童维勤 《计算机工程与设计》 北大核心 2024年第3期699-706,共8页
为提升轻量级卷积神经网络在硬件平台的资源利用效率和推理速度,基于软硬件协同优化的思想,提出一种面向FPGA平台的轻量级卷积神经网络加速器,并针对网络结构的特性设计专门的硬件架构。与多级并行策略结合,设计一种统一的卷积层计算单... 为提升轻量级卷积神经网络在硬件平台的资源利用效率和推理速度,基于软硬件协同优化的思想,提出一种面向FPGA平台的轻量级卷积神经网络加速器,并针对网络结构的特性设计专门的硬件架构。与多级并行策略结合,设计一种统一的卷积层计算单元。为降低模型存储成本、提高加速器的吞吐量,提出一种基于可微阈值的选择性移位量化方案,使计算单元能够以硬件友好的形式执行计算。实验结果表明,在Arria 10 FPGA平台上部署的MobileNetV2加速器能够达到311 fps的推理速度,相比CPU版本实现了约9.3倍的加速比、GPU版本约3倍的加速比。在吞吐量方面,加速器能够实现98.62 GOPS。 展开更多
关键词 软硬件协同优化 现场可编程门阵列 轻量级卷积神经网络 移位量化 并行计算 硬件加速 开放式计算语言
在线阅读 下载PDF
基于动态可重构结构的卷积数据复用优化设计 被引量:1
5
作者 宋佳 蒋林 +1 位作者 朱育琳 朱家扬 《传感器与微系统》 CSCD 北大核心 2024年第6期105-108,共4页
针对卷积神经网络(CNN)计算效率低、速度慢、硬件资源消耗大等问题,提出了基于动态可重构结构的卷积数据复用优化设计方案。利用可重构阵列邻接互连寄存器实现输入特征图数据和权值数据的复用,提高内存访问效率,采用层间多通道并行计算... 针对卷积神经网络(CNN)计算效率低、速度慢、硬件资源消耗大等问题,提出了基于动态可重构结构的卷积数据复用优化设计方案。利用可重构阵列邻接互连寄存器实现输入特征图数据和权值数据的复用,提高内存访问效率,采用层间多通道并行计算对神经网络卷积运算进行加速。经在AlexNet上测试,论文提出的数据复用策略使得卷积运算乘累加操作最高可减少44.05%。在Zynq—7000开发板上实现本文提出的优化方案。结果表明:相比于现有的基于现场可编程门阵列(FPGA)实现AlexNet的计算,本实验LUTs资源消耗减少12.86%、FF资源消耗减少约97.5%、DSP资源消耗减少约66.7%。 展开更多
关键词 卷积神经网络 并行计算 数据复用
在线阅读 下载PDF
基于APSOC的心音特征提取及分类
6
作者 田英杰 杨宏波 +3 位作者 汪琴 郭涛 潘家华 王威廉 《计算机工程与设计》 北大核心 2024年第12期3779-3785,共7页
在云南一些边远山区网络信号弱甚至无信号,为在便携式设备上实现心音分类算法,满足离线式、可移动的需求,提出一种可部署在APSOC平台上的心音分类方法。在PS部分实现心音信号的特征提取,在PL部分实现CNN的卷积层和池化层。使用多通道并... 在云南一些边远山区网络信号弱甚至无信号,为在便携式设备上实现心音分类算法,满足离线式、可移动的需求,提出一种可部署在APSOC平台上的心音分类方法。在PS部分实现心音信号的特征提取,在PL部分实现CNN的卷积层和池化层。使用多通道并行及流水线等方式,实现对系统的硬件加速。实验结果表明,与通用CPU相比,该方法实现了8.91倍的硬件加速,分类准确率仅损失了2%,对心音辅助诊断有实用价值。 展开更多
关键词 全可编程片上系统 心音分类 先天性心脏病 硬件加速 卷积神经网络 梅尔频率倒谱系数 并行计算
在线阅读 下载PDF
一种面向通用计算设备的自动流水线并行训练框架
7
作者 钟震宇 林勇良 +3 位作者 王昊天 李东闻 孙羽菲 张玉志 《计算机科学》 CSCD 北大核心 2024年第12期129-136,共8页
训练大规模神经网络通常会出现单个计算节点的内存和计算能力不足的情况,需要通过多个节点分布式训练来实现。现有的分布式深度学习框架主要针对特定的硬件环境设计,不能够有效适应各类通用计算设备。为支持大规模深度神经网络的高效训... 训练大规模神经网络通常会出现单个计算节点的内存和计算能力不足的情况,需要通过多个节点分布式训练来实现。现有的分布式深度学习框架主要针对特定的硬件环境设计,不能够有效适应各类通用计算设备。为支持大规模深度神经网络的高效训练,实现了一种通用的自动流水线并行分布式训练框架。本框架通过结合基于流水线并行的模型并行策略与神经网络模型自动拆分算法,实现了在包括国内新一代超级计算机在内的通用计算机集群上,对大规模神经网络模型与训练数据进行自动并行化处理和训练,显著减轻单个计算节点的内存和计算压力。该框架无需人工调整,可以自动高效地在多节点分布式环境中部署深度神经网络,不仅适用于超级计算机等高性能计算机集群,还可以部署到其他通用的分布式计算环境中,为大规模神经网络的自动化分布式训练提供支持。 展开更多
关键词 流水线并行 深度神经网络 超级计算机 MPI 并行计算
在线阅读 下载PDF
深度神经网络并行化研究综述 被引量:62
8
作者 朱虎明 李佩 +2 位作者 焦李成 杨淑媛 侯彪 《计算机学报》 EI CSCD 北大核心 2018年第8期1861-1881,共21页
神经网络是人工智能领域的核心研究内容之一.在七十年的发展历史中,神经网络经历了从浅层神经网络到深度神经网络的重要变革.深度神经网络通过增加模型深度来提高其特征提取和数据拟合的能力,在自然语言处理、自动驾驶、图像分析等问题... 神经网络是人工智能领域的核心研究内容之一.在七十年的发展历史中,神经网络经历了从浅层神经网络到深度神经网络的重要变革.深度神经网络通过增加模型深度来提高其特征提取和数据拟合的能力,在自然语言处理、自动驾驶、图像分析等问题上相较浅层模型具有显著优势.随着训练数据规模的增加和模型的日趋复杂,深度神经网络的训练成本越来越高,并行化成为增强其应用时效性的重要技术手段.近年来计算平台的硬件架构更新迭代,计算能力飞速提高,特别是多核众核以及分布式异构计算平台发展迅速,为深度神经网络的并行化提供了硬件基础;另一方面,日趋丰富的并行编程框架也为计算设备和深度神经网络的并行化架起了桥梁.该文首先介绍了深度神经网络发展背景和常用的计算模型,然后对多核处理器、众核处理器和异构计算设备分别从功耗、计算能力、并行算法的开发难度等角度进行对比分析,对并行编程框架分别从支持的编程语言和硬件设备、编程难度等角度进行阐述.然后以AlexNet为例分析了深度神经网络模型并行和数据并行两种方法的实施过程.接下来,从支持硬件、并行接口、并行模式等角度比较了常用的深度神经网络开源软件,并且通过实验比较和分析了卷积神经网络在多核CPU和GPU上的并行性能.最后,对并行深度神经网络的未来发展趋势和面临的挑战进行展望. 展开更多
关键词 深度神经网络 并行计算 异构计算 模型并行 数据并行
在线阅读 下载PDF
神经网络七十年:回顾与展望 被引量:393
9
作者 焦李成 杨淑媛 +2 位作者 刘芳 王士刚 冯志玺 《计算机学报》 EI CSCD 北大核心 2016年第8期1697-1716,共20页
作为联接主义智能实现的典范,神经网络采用广泛互联的结构与有效的学习机制来模拟人脑信息处理的过程,是人工智能发展中的重要方法,也是当前类脑智能研究中的有效工具.在七十年的发展历程中,神经网络曾历经质疑、批判与冷落,同时也几度... 作为联接主义智能实现的典范,神经网络采用广泛互联的结构与有效的学习机制来模拟人脑信息处理的过程,是人工智能发展中的重要方法,也是当前类脑智能研究中的有效工具.在七十年的发展历程中,神经网络曾历经质疑、批判与冷落,同时也几度繁荣并取得了许多瞩目的成就.从20世纪40年代的M-P神经元和Hebb学习规则,到50年代的Hodykin-Huxley方程、感知器模型与自适应滤波器,再到60年代的自组织映射网络、神经认知机、自适应共振网络,许多神经计算模型都发展成为信号处理、计算机视觉、自然语言处理与优化计算等领域的经典方法,为该领域带来了里程碑式的影响.目前,模拟人脑复杂的层次化认知特点的深度学习已经成为类脑智能中的一个重要研究方向.通过增加网络层数所构造的"深层神经网络"使机器能够获得"抽象概念"能力,在诸多领域都取得了巨大的成功,又掀起了神经网络研究的一个新高潮.文中回顾了神经网络的发展历程,综述了其当前研究进展以及存在的问题,展望了未来神经网络的发展方向. 展开更多
关键词 类脑智能 神经网络 深度学习 大数据 并行计算 机器学习
在线阅读 下载PDF
结构分析和设计中神经网络计算研究评述 被引量:9
10
作者 高行山 李红达 叶天麒 《计算力学学报》 CAS CSCD 2000年第2期223-228,共6页
综述了工程结构分析和设计中神经网络计算研究的现状与趋势 ,指出了进一步发展神经计算的策略及方向。
关键词 结构分析 神经网络 并行计算
在线阅读 下载PDF
神经计算机及其研究进展 被引量:2
11
作者 胡德文 王正志 张良起 《国防科技大学学报》 EI CAS CSCD 北大核心 1992年第1期63-68,共6页
本文分析比较了神经计算机与传统计算机的联系与区别。在软件实现、虚拟实现和全硬件实现三个方面,综述了近年来国际神经计算机的研究进展。最后,在就神经网络的兴衰原因提出自己的不同看法后,对神经计算机的发展方向作了展望。
关键词 神经计算机 神经网络 并行计算
在线阅读 下载PDF
基于Spark框架和PSO优化算法的电力通信网络安全态势预测 被引量:19
12
作者 金鑫 李龙威 +2 位作者 苏国华 刘晓蕾 季佳男 《计算机科学》 CSCD 北大核心 2017年第S1期366-371,共6页
随着电力通信网络规模的不断扩大,电力通信网络不间断地产生海量通信数据。同时,对通信网络的攻击手段也在不断进化,给电力通信网络的安全造成极大威胁。针对以上问题,结合Spark大数据计算框架和PSO优化神经网络算法的优点,提出基于Spar... 随着电力通信网络规模的不断扩大,电力通信网络不间断地产生海量通信数据。同时,对通信网络的攻击手段也在不断进化,给电力通信网络的安全造成极大威胁。针对以上问题,结合Spark大数据计算框架和PSO优化神经网络算法的优点,提出基于Spark内存计算框架的并行PSO优化神经网络算法对电力通信网络的安全态势进行预测。本研究首先引入Spark计算框架,Spark框架具有内存计算以及准实时处理的特点,符合电力通信大数据处理的要求。然后提出PSO优化算法对神经网络的权值进行修正,以增加神经网络的学习效率和准确性。之后结合RDD的并行特点,提出了一种并行PSO优化神经网络算法。最后通过实验比较可以看出,基于Spark框架的PSO优化神经网络算法的准确度高,且相较于传统基于Hadoop的预测方法在处理速度上有显著提高。 展开更多
关键词 Spark计算框架 粒子群算法 并行PSO优化神经网络 电力通信网络 安全态势预测
在线阅读 下载PDF
RBF神经网络补偿的并联机器人控制研究 被引量:7
13
作者 彭志文 高宏力 +1 位作者 梁超 文刚 《机械设计与制造》 北大核心 2018年第3期252-254,259,共4页
为了实现对三自由度Delta并联机器人更精确的轨迹跟踪控制,对并联机构的动力学建模不确定性进行研究,提出了计算力矩控制基础上的RBF神经网络在线补偿控制策略。利用Lyapunov理论推导了神经网络在线权值自适应律,保证了系统稳定性。运用... 为了实现对三自由度Delta并联机器人更精确的轨迹跟踪控制,对并联机构的动力学建模不确定性进行研究,提出了计算力矩控制基础上的RBF神经网络在线补偿控制策略。利用Lyapunov理论推导了神经网络在线权值自适应律,保证了系统稳定性。运用RBF神经网络在线自学习系统的不确定性,提高了控制效率同时增加算法的自适应性。在Simmechanics中建立系统物理模型并在Simulink中设计控制器,之后进行Simulimk/Simmechanics联合仿真,结果表明算法优于计算力矩控制,可以有效减小跟踪误差的收敛半径,实现对目标轨迹的准确跟踪。 展开更多
关键词 Delta并联机器人 计算力矩 RBF神经网络 SIMMECHANICS
在线阅读 下载PDF
并行广义神经网络的交通流预测 被引量:4
14
作者 王凡 谭国真 +1 位作者 史慧敏 徐玉霞 《计算机工程与应用》 CSCD 北大核心 2010年第17期229-231,共3页
实时、准确的交通流预测是智能交通诱导实现的前提和关键。针对BP神经网络学习过程收敛速度慢、容易陷入局部极小的缺点,引入智能神经元组成的广义神经网络建立交通流预测模型,同时给出基于训练集分解和动态通信模式的并行学习算法来提... 实时、准确的交通流预测是智能交通诱导实现的前提和关键。针对BP神经网络学习过程收敛速度慢、容易陷入局部极小的缺点,引入智能神经元组成的广义神经网络建立交通流预测模型,同时给出基于训练集分解和动态通信模式的并行学习算法来提高广义神经网络的收敛速度,并利用大连市的实际交通流数据进行预测分析。实验结果表明,并行广义神经网络能够满足交通流量预测实时性、精确性的要求,具有一定的应用价值。 展开更多
关键词 交通流预测 广义神经网络 并行计算
在线阅读 下载PDF
基于PSO算法的神经网络集成入侵检测系统 被引量:7
15
作者 李朝荣 张鹰 张安妮 《计算机工程》 CAS CSCD 北大核心 2007年第14期123-124,127,共3页
在系统结构上提出了一种多检测器并行的智能机群入侵检测系统模型,系统中每一个检测器是一个神经网络集成分类检测器,由多个PC组成,以提高系统响应速度。采用两次粒子群优化算法选择性集成神经网络集,提高了神经网络集成检测器的预测精... 在系统结构上提出了一种多检测器并行的智能机群入侵检测系统模型,系统中每一个检测器是一个神经网络集成分类检测器,由多个PC组成,以提高系统响应速度。采用两次粒子群优化算法选择性集成神经网络集,提高了神经网络集成检测器的预测精度。程序设计采用PVM并行方式实现。 展开更多
关键词 入侵检测系统 神经网络集成 选择性集成 粒子群优化 并行计算
在线阅读 下载PDF
一种递归神经网络的快速并行算法 被引量:14
16
作者 李鸿儒 顾树生 《自动化学报》 EI CSCD 北大核心 2004年第4期516-522,共7页
针对递归神经网络BP(Back Propagation)学习算法收敛慢的缺陷,提出一种新的递归神经网络快速并行学习算法.首先,引入递推预报误差(RPE)学习算法,并且证明了其稳定性;进一步地,为了克服RPE算法集中运算的不足,设计完整的并行结构算法.本... 针对递归神经网络BP(Back Propagation)学习算法收敛慢的缺陷,提出一种新的递归神经网络快速并行学习算法.首先,引入递推预报误差(RPE)学习算法,并且证明了其稳定性;进一步地,为了克服RPE算法集中运算的不足,设计完整的并行结构算法.本算法将计算分配到神经网络中的每个神经元,完全符合神经网络的并行结构特点,也利于硬件实现.仿真结果表明,该算法比传统的递归BP学习算法具有更好的收敛性能.理论分析和仿真实验证明,该算法与RPE集中运算算法相比可以大大节省计算时间. 展开更多
关键词 递归神经网络 递推预报误差 并行算法 集中运算
在线阅读 下载PDF
采用细胞神经网络结构进行图像加密的框架及算法 被引量:4
17
作者 周庆 廖晓峰 胡月 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2009年第11期1676-1681,共6页
为提高图像加密算法的安全性和速度,基于细胞神经网络的并行计算和局部扩散特点,提出一种图像分组加密框架,并设计出相应的加密算法.在每轮加密中,各细胞先对其负责的图像块进行像素混合、轮密钥异或和S盒替代加密操作,再与相邻8个细胞... 为提高图像加密算法的安全性和速度,基于细胞神经网络的并行计算和局部扩散特点,提出一种图像分组加密框架,并设计出相应的加密算法.在每轮加密中,各细胞先对其负责的图像块进行像素混合、轮密钥异或和S盒替代加密操作,再与相邻8个细胞的输出进行异或运算.该算法适于VLSI实现,且支持并行计算.理论分析和实验结果表明,该算法在安全性能方面表现优异. 展开更多
关键词 细胞神经网络 图像加密 并行计算 密码学
在线阅读 下载PDF
人工神经网络 被引量:3
18
作者 陈松灿 杨国庆 徐涛 《南京航空学院学报》 CSCD 1990年第2期98-105,共8页
本文叙述了人工神经网络的基本概念、信息处理原理及主要特征。分析了Hopfield、误差反向传播等典型神经网络模型的互连结构、学习方法及特点。对该学科的发展及今后人工智能的研究策略也作了简要阐述。
关键词 神经网络 人工智能 神经计算机
在线阅读 下载PDF
极度并行计算:演化算法和演化神经网络的研究进展 被引量:2
19
作者 宋爱国 陆佶人 《系统仿真学报》 CAS CSCD 1998年第1期14-19,共6页
演化算法、神经网络以及两者的结合作为一种极度并行的计算,已引起人们极大的注意。本文首先对演化算法的不同流派作了比较和分析;然后对演化算法与神经网络的结合作了回顾与展望,并讨论了演化神经网络的并行实现模式;最后指出了演... 演化算法、神经网络以及两者的结合作为一种极度并行的计算,已引起人们极大的注意。本文首先对演化算法的不同流派作了比较和分析;然后对演化算法与神经网络的结合作了回顾与展望,并讨论了演化神经网络的并行实现模式;最后指出了演化算法及演化神经网络有待解决的几个关键问题。 展开更多
关键词 并行计算 演化算法 神经网络 计算机 算法
在线阅读 下载PDF
广义细胞自动机的结构及其硬件实现 被引量:1
20
作者 帅典勋 冯翔 +1 位作者 赵宏彬 王兴 《计算机学报》 EI CSCD 北大核心 2004年第11期1441-1450,共10页
该文作者曾提出了广义细胞自动机 (GCA)的原理和并行算法 ,并且应用于网络快速包交换等动态优化问题 .该文进一步讨论了这种新的广义细胞自动机的体系结构、算法的硬件实现及其电路设计 ,它们对于GCA的实际应用有重要意义 .GCA结构不同... 该文作者曾提出了广义细胞自动机 (GCA)的原理和并行算法 ,并且应用于网络快速包交换等动态优化问题 .该文进一步讨论了这种新的广义细胞自动机的体系结构、算法的硬件实现及其电路设计 ,它们对于GCA的实际应用有重要意义 .GCA结构不同于Hopfield神经网络 (HNN)和细胞神经网络 (CNN) ,GCA由多层次多粒度宏细胞组成塔形结构 ,它具有多粒度的宏细胞动力学特征 ,相同粒度宏细胞之间没有交互 ,但不同粒度宏细胞之间存在一定程度的交互或反馈 .分析和实验表明 ,在问题求解的优化性、实时性、硬件实现复杂性等方面 ,该文给出的GCA结构和硬件实现 ,与HNN和CNN相比有诸多优点 . 展开更多
关键词 并行结构 并行计算 电路实现 细胞神经网络 广义细胞自动机
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部