期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
MTTorch:面向MT-3000芯片和Transformer模型的PyTorch算子库实现与优化
1
作者 王昊天 孙羽菲 +4 位作者 隋轶丞 王嘉豪 石昌青 方建滨 张玉志 《软件学报》 北大核心 2025年第8期3896-3916,共21页
随着Transformer类大模型的飞速发展,算力逐渐成为制约领域发展的瓶颈,如何根据加速器硬件的结构特性加速和优化大语言模型的训练性能已成为研究热点.面向天河新一代超算系统的加速芯片MT-3000,提出并实现了适用于CPU+DSP异构架构的PyTo... 随着Transformer类大模型的飞速发展,算力逐渐成为制约领域发展的瓶颈,如何根据加速器硬件的结构特性加速和优化大语言模型的训练性能已成为研究热点.面向天河新一代超算系统的加速芯片MT-3000,提出并实现了适用于CPU+DSP异构架构的PyTorch扩展库——MTTorch,其核心是一个多核并行的算子库,对Transformer类模型训练过程中的核心算子进行向量化实现和优化.同时,针对MT-3000架构特性,提出了面向多核DSP的高性能规约算法及乒乓算法,显著提升了算子的运算性能.MTTorch还具有很好的通用性,对于不同版本的PyTorch都可以动态链接库的形式进行加载,不改变PyTorch的原生实现.大量实验证明,实现的核心算子在MT-3000芯片上有着很好的性能,在单DSP簇上可以达到8倍的加速效果.利用MTTorch在多节点执行训练任务时有着接近线性的加速比,极大地提升了Transformer类模型在MT-3000芯片上的训练效率. 展开更多
关键词 pytorch 高性能计算 Transformer模型 天河超级计算机 CPU+DSP异构计算 软件生态
在线阅读 下载PDF
基于PyTorch深度学习框架的武汉市森林资源变化监测模型研究 被引量:2
2
作者 邓春成 孙巧峰 +3 位作者 唐星 李艳丽 卢秉俊 陶章思 《中南林业调查规划》 2025年第1期45-49,共5页
基于武汉市2期遥感影像数据,采集变化识别样本,采用深度学习框架PyTorch对样本模型进行训练、效果预测,构建变化监测模型,利用变化监测模型进行遥感影像变化信息的提取,形成变化提取成果。结果显示:武汉市森林资源变化识别准确率达88.1%... 基于武汉市2期遥感影像数据,采集变化识别样本,采用深度学习框架PyTorch对样本模型进行训练、效果预测,构建变化监测模型,利用变化监测模型进行遥感影像变化信息的提取,形成变化提取成果。结果显示:武汉市森林资源变化识别准确率达88.1%,召回率达88.5%,且随着样本数量的增加和影像质量的提升,基于深度学习框架的变化识别提取准确率和召回率也得到了提升。构建的武汉市森林资源变化监测模型可应用于森林资源变化识别,能够为森林资源监测监管提供疑似变化图斑,及时准确地发现森林违法活动、林业灾害等信息,具有较大的实际应用价值和潜力。 展开更多
关键词 深度学习 遥感影像 森林资源 变化监测模型 pytorch
在线阅读 下载PDF
面向迈创3000异构处理器的多头注意力机制多重并行优化
3
作者 路瑶 栾钟治 +4 位作者 李根 齐家兴 韩斌 杨海龙 钱德沛 《计算机学报》 北大核心 2025年第9期2049-2063,共15页
针对迈创3000(MT-3000)异构多核处理器在带宽不足场景下多头注意力(Multi-Head Attention,MHA)计算效率低的问题,本文提出了一套涵盖算子优化、访存优化与调度优化的综合方案,以加速PyTorch框架中的MHA推理。通过融合MT-3000的VLIW指令... 针对迈创3000(MT-3000)异构多核处理器在带宽不足场景下多头注意力(Multi-Head Attention,MHA)计算效率低的问题,本文提出了一套涵盖算子优化、访存优化与调度优化的综合方案,以加速PyTorch框架中的MHA推理。通过融合MT-3000的VLIW指令集、片上存储层次和DMA传输特性,设计了三方面的优化策略:在算子方面,对Linear和Softmax等算子进行内核级优化与算子融合,减少计算与访存开销;在访存方面,利用广播机制与全局共享内存(GSM)优化数据流,降低主存带宽依赖;在调度方面,以行为粒度分块并行,隐藏数据传输延迟。实验表明,优化后的Linear算子单簇峰值性能达1.53 TFLOPS,占理论峰值的37.7%,较NVIDIA V100 GPU加速比最高达5.34倍;在典型大语言模型配置下(嵌入维度4096/8192,头数32/64),MHA机制相较NVIDIA V100 GPU实现最高23.53倍加速,且在单节点多簇环境中扩展性良好。本研究为MT-3000在长序列推理任务中的高效部署提供了解决方案,并为天河超算支持大语言模型等复杂AI任务奠定了技术基础。 展开更多
关键词 MT-3000 多头注意力 性能优化 pytorch 加速比
在线阅读 下载PDF
基于深度学习的西瓜病虫害检测研究 被引量:1
4
作者 吴瑞强 卓怀成 +2 位作者 刘双印 刘同来 高学凯 《农业与技术》 2025年第5期1-6,共6页
基于深度学习的西瓜病虫害检测研究,其意义是识别常见的西瓜病虫害,提供一种防治手段。系统基于Python语言开发技术,采用Pytorch框架,探索3种市面上常用的图像分类算法——VGG、GoogLeNet和ResNet在西瓜病虫害识别中的优劣性,对收集到的... 基于深度学习的西瓜病虫害检测研究,其意义是识别常见的西瓜病虫害,提供一种防治手段。系统基于Python语言开发技术,采用Pytorch框架,探索3种市面上常用的图像分类算法——VGG、GoogLeNet和ResNet在西瓜病虫害识别中的优劣性,对收集到的4种西瓜病虫害,采用迁移学习策略训练模型,实现了平均超过95%的识别准确率,通过识别速度和模型评估指标进行分析对比。实践证明,本研究采用的算法行之有效,能有效识别4种西瓜病虫害。 展开更多
关键词 西瓜病虫害 迁移学习 pytorch 图像分类算法
在线阅读 下载PDF
集成Vissim-Python和Qt的信控交叉口DRL配时仿真系统设计 被引量:7
5
作者 任安虎 李珊 《计算机应用与软件》 北大核心 2024年第11期53-59,122,共8页
针对目前Vissim-Python联合仿真系统在信控交叉口DRL配时研究中算法移植性不高且难以实际应用的问题,设计一款交叉口配时仿真系统。在该系统中,为满足实际应用的需要,提出同时考虑检测器数据和倒计时的DRL配时模型,根据此模型需求,通过P... 针对目前Vissim-Python联合仿真系统在信控交叉口DRL配时研究中算法移植性不高且难以实际应用的问题,设计一款交叉口配时仿真系统。在该系统中,为满足实际应用的需要,提出同时考虑检测器数据和倒计时的DRL配时模型,根据此模型需求,通过Python设计必要的Vissim组件接口,并封装为Gym强化学习仿真环境。为解决算法移植性不高的问题,基于深度学习框架PyTorch对配时算法的接口规范化,并使用PyQt5设计可视化操作界面,可灵活调整算法参数。为提高系统运行效率,使用四种技巧加速仿真进程。最后以珠海市柠溪路与兴业路交叉口为例进行仿真测试,结果表明,该系统运行良好,既可对实际交叉口的配时效果进行评估,也可作为相关算法研究者的测试平台。 展开更多
关键词 交叉口配时 深度强化学习 VISSIM仿真 Python程序 Qt界面 pytorch
在线阅读 下载PDF
基于Transformer神经网络的锂电池热失控多数据融合探测 被引量:1
6
作者 丁沐涛 郭世伟 +1 位作者 单志林 张启兴 《消防科学与技术》 CAS 北大核心 2024年第7期937-945,共9页
为满足对锂离子电池热失控高效准确探测的需求,设计了一种锂电池热失控试验平台,并利用STM32F103ZET6单片机连接了CO、CO_(2)、H2和热敏电阻NTC共4种传感器,实时采集特征参量。同时,利用PyroSim模拟试验环境,生成高质量的模拟数据,以补... 为满足对锂离子电池热失控高效准确探测的需求,设计了一种锂电池热失控试验平台,并利用STM32F103ZET6单片机连接了CO、CO_(2)、H2和热敏电阻NTC共4种传感器,实时采集特征参量。同时,利用PyroSim模拟试验环境,生成高质量的模拟数据,以补充试验数据。基于PyTorch平台,设计了一个Transformer神经网络,能够输出锂电池的正常、预警和热失控3种状态。通过使用试验数据和模拟数据进行训练,实现了对锂电池热失控的融合探测,相比于其他算法有一定的优势。 展开更多
关键词 热失控 特征参量 PyroSim pytorch Trans⁃former 数据融合
在线阅读 下载PDF
基于神经网络的气囊隔振装置对中状态评估方法
7
作者 刘志伟 施亮 刘松 《中国舰船研究》 CSCD 北大核心 2024年第6期117-125,共9页
[目的]针对现有轴系对中状态监测模型难以准确描述非线性、时变条件下对中状态的难题,提出一种基于神经网络模型的对中状态评估方法。[方法]首先,建立基于BP神经网络的对中状态预测模型,制定典型工况下的训练与测试数据获取方式,对数据... [目的]针对现有轴系对中状态监测模型难以准确描述非线性、时变条件下对中状态的难题,提出一种基于神经网络模型的对中状态评估方法。[方法]首先,建立基于BP神经网络的对中状态预测模型,制定典型工况下的训练与测试数据获取方式,对数据进行移动平均降噪处理,并总结模型超参数的调整规律;然后,分别在小型及大型气囊隔振装置上开展试验研究。[结果]结果显示,建立的神经网络模型仅通过气囊压力数据,即可准确预测隔振装置的对中状态,且在不同型号的装置间有较强的通用性,预测误差小于0.5,对中预测准确度可达96.29%。[结论]所建立的模型不依赖系统参数,在小型和大型装置的对中状态预测中均表现良好,可为动力设备启动后的动态对中状态预测及轴系对中控制提供理论支撑. 展开更多
关键词 轴系 对中 气囊隔振装置 神经网络 pytorch
在线阅读 下载PDF
基于IPEX-LLM的本地轻量化课程教学智能辅助系统 被引量:6
8
作者 张嘉睿 张豈明 +4 位作者 毕枫林 张琰彬 王伟 任而今 张海立 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第5期162-172,共11页
提出并实现了一个本地轻量化课程教学智能辅助系统.该系统利用IPEX-LLM(Intel PyTorch extention for large language model)加速库,在计算资源受限的设备上高效部署并运行经过QLoRA(quantum-logic optimized resource allocation)框架... 提出并实现了一个本地轻量化课程教学智能辅助系统.该系统利用IPEX-LLM(Intel PyTorch extention for large language model)加速库,在计算资源受限的设备上高效部署并运行经过QLoRA(quantum-logic optimized resource allocation)框架微调的大语言模型,并结合增强检索技术,实现了智能问答、智能出题、教学大纲生成、教学演示文档生成等4个主要功能模块的课程灵活定制,在帮助教师提高教学备课和授课的质量与效率、保护数据隐私的同时,支撑学生个性化学习并提供实时反馈.在性能实验中,以集成优化后的Chatglm3-6B模型为例,该系统处理64-token输出任务时仅需4.08 s,验证了其在资源受限环境下快速推理的能力.在实践案例分析中,通过与原生Chatgml-6B和ChatGPT4.0在功能实现上的对比,进一步表明了该系统具备优越的准确性和实用性. 展开更多
关键词 智能辅助 计算资源受限 IPEX-LLM 微调 增强检索
在线阅读 下载PDF
利用多时间尺度卷积的视频行为识别网络 被引量:2
9
作者 陈西江 梁全恩 +1 位作者 韩贤权 安庆 《国防科技大学学报》 EI CAS CSCD 北大核心 2023年第3期136-145,共10页
基于2D的行为识别网络通常融合多张视频帧的分类结果识别不同的行为,但其在卷积过程中缺少对时空特征提取。针对该问题,基于时间位移模块(temporal shift module,TSM)的思想设计了一组多时间尺度卷积,包含不同设计的卷积核以提取融合不... 基于2D的行为识别网络通常融合多张视频帧的分类结果识别不同的行为,但其在卷积过程中缺少对时空特征提取。针对该问题,基于时间位移模块(temporal shift module,TSM)的思想设计了一组多时间尺度卷积,包含不同设计的卷积核以提取融合不同时间尺度的时空信息。通过控制多时间尺度卷积嵌入ResNet50网络的位置及其模块的参数设置,寻找最优的基于多时间尺度卷积的行为识别网络。使用PyTorch深度学习框架训练模型,在大型开源数据集Something-Something v2上进行了实验研究。结果表明,基于多时间尺度卷积的行为识别网络对行为识别准确率达到了59.47%,优于TSM等网络。 展开更多
关键词 行为识别 卷积神经网络 分类 残差神经网络 pytorch
在线阅读 下载PDF
基于SE模块和ResNet的番茄病虫害识别方法 被引量:14
10
作者 胡文艺 王洪坤 杜育佳 《农业工程》 2022年第9期33-40,共8页
番茄病虫害是引起番茄减产的重要因素。精确识别病虫害种类是当前国际热点问题之一,有助于及时有效采取针对性的病虫防治办法,减少和避免因番茄减产导致的经济损失。针对传统虫害识别方法存在效率和精确率低的问题,利用Kaggle网站上的To... 番茄病虫害是引起番茄减产的重要因素。精确识别病虫害种类是当前国际热点问题之一,有助于及时有效采取针对性的病虫防治办法,减少和避免因番茄减产导致的经济损失。针对传统虫害识别方法存在效率和精确率低的问题,利用Kaggle网站上的Tomato数据集,构建基于压缩和激励(SE)模块的深度残差网络模型(ResNet),优化番茄病虫害识别方法。结果表明:通过Pytorch框架下的迁移学习,改进后的网络模型对番茄病虫害图像的平均识别准确率最高为97.96%;基于SE模块的ResNet网络模型有助于增强特征区分能力,增加模型的通用性和鲁棒性。研究结果对番茄病虫害的及时监测和处理、提高番茄产量具有重要意义。 展开更多
关键词 番茄 病虫害识别 迁移学习 压缩和激励模块 深度残差网络模型 pytorch
在线阅读 下载PDF
基于ResNet18的图像分类在农作物病虫害诊断中的应用 被引量:8
11
作者 赵春霞 《农业与技术》 2021年第19期10-13,共4页
使用Pytorch框架搭建ResNet18网络模型,优化网络参数和结构,基于深度学习的图像分类方法,通过数据清洗、图像数据预处理、数据加载、模型设计与搭建、进行不同周期的训练与测试,对模型进行评估,得到农作物病虫害10分类最佳模型和参数,... 使用Pytorch框架搭建ResNet18网络模型,优化网络参数和结构,基于深度学习的图像分类方法,通过数据清洗、图像数据预处理、数据加载、模型设计与搭建、进行不同周期的训练与测试,对模型进行评估,得到农作物病虫害10分类最佳模型和参数,并建立网络应用,进行农作物病虫害图片诊断和识别,最终应用于实际农作物病虫害种类的诊断中。 展开更多
关键词 图像分类 ResNet18 pytorch
在线阅读 下载PDF
深度学习在电梯轿厢振动故障诊断中的应用研究 被引量:11
12
作者 张兴合 高丙朋 +1 位作者 陈飞 南新元 《机电工程》 CAS 北大核心 2021年第2期260-264,共5页
在电梯系统运行过程中,针对故障诊断精确度不够高的问题,以及电梯轿厢振动故障诊断在卷积神经网络运用上的空白,采用电梯承运质量测试仪采集了电梯运行过程中的大量振动信号,并对信号进行了分离和筛选;采用了连续小波对预处理后的信号... 在电梯系统运行过程中,针对故障诊断精确度不够高的问题,以及电梯轿厢振动故障诊断在卷积神经网络运用上的空白,采用电梯承运质量测试仪采集了电梯运行过程中的大量振动信号,并对信号进行了分离和筛选;采用了连续小波对预处理后的信号进行了时频变换,以变换后的RGB图像作为深度学习模型输入;研究了深度学习在电梯轿厢振动故障诊断中的应用,设计了电梯轿厢振动故障诊断整体方案,并通过PyTorch实现了深度学习方案,将卷积神经网络应用到电梯轿厢振动故障诊断中,通过监督学习对深度残差神经网络进行了分析和训练,并与传统机器学习方法进行了对比。研究结果表明:深度学习故障诊断方案诊断正确率比传统机器学习故障诊断方法提高3%;深度学习方案能有效诊断电梯故障,为电梯故障诊断开辟新路径。 展开更多
关键词 电梯轿厢振动 故障诊断 卷积神经网络 深度学习 pytorch 监督学习
在线阅读 下载PDF
一种基于深度网络的少样本学习方法 被引量:2
13
作者 余游 冯林 +1 位作者 王格格 徐其凤 《小型微型计算机系统》 CSCD 北大核心 2019年第11期2304-2308,共5页
少样本学习是目前机器学习研究领域的热点与难点.在源域和目标域分布差异很大的情况下,现有的主流少样本学习算法训练得到的模型,泛化能力较弱,导致识别率不高.针对这个问题,提出一种基于深度网络的少样本学习方法 DL-FSL(Deep Learning... 少样本学习是目前机器学习研究领域的热点与难点.在源域和目标域分布差异很大的情况下,现有的主流少样本学习算法训练得到的模型,泛化能力较弱,导致识别率不高.针对这个问题,提出一种基于深度网络的少样本学习方法 DL-FSL(Deep Learning-based Few-Shot Learning,DL-FSL).首先,采用Bagging方法有放回地随机采样方式产生不同的训练集,针对不同的训练集,分别产生样本集、查询集.其次,建立多条异步线程,利用关系型网络学习算法以及Pytorch深度学习框架并行训练出多个不同的基模型;然后,采用概率投票方式对不同的基模型进行融合.实验结果表明,与现有方法相比,DL-FSL方法在源域和目标域分布差异很大的情况下能有效地提高少样本学习算法的识别率. 展开更多
关键词 深度网络 Bagging模型 少样本学习 pytorch
在线阅读 下载PDF
基于深度学习技术的恶意攻击的分析与识别 被引量:6
14
作者 张超群 韦川源 +2 位作者 梁刚 黑小龙 朱旭东 《计算机应用研究》 CSCD 北大核心 2020年第S01期283-286,289,共5页
对网站恶意攻击展开研究,通过在单机环境和具有1台服务器、2台客户机的局域网环境下模拟暴力破解、撞库、分布式拒绝服务攻击网站,以人工标注网站日志数据,训练一个LSTM网络分类模型,利用监控脚本在线监控网站日志,将日志数据转换成结... 对网站恶意攻击展开研究,通过在单机环境和具有1台服务器、2台客户机的局域网环境下模拟暴力破解、撞库、分布式拒绝服务攻击网站,以人工标注网站日志数据,训练一个LSTM网络分类模型,利用监控脚本在线监控网站日志,将日志数据转换成结构化数据并输入训练好的LSTM网络进行分类,以区分恶意攻击产生的日志和正常日志,达到识别恶意攻击类型的目的。在测试集数据上,分类准确率达到99%以上。按类似的思路,还构建一个基于自编码器和LSTM网络的分类模型,用KDD99数据集对该分类器进行训练和测试。实验结果表明,平均分类准确率约为99.7%,明显优于其他比较方法。网络攻击数据通常隐式地具有序列特征,将分类问题转换为序列标注问题,并用深度学习技术来求解,其整体解决思路是合理且有效的,可为后续的安全防护提供有效支持。 展开更多
关键词 深度学习 恶意攻击 LSTM网络 pytorch框架 Nginx日志 KDD99数据集
在线阅读 下载PDF
基于Resnet50的西藏高原地区玉米病害识别系统 被引量:6
15
作者 张正超 方文博 郭永刚 《高原农业》 2022年第2期164-172,212,共10页
本文基于计算机视觉,采用PyTorch框架,Resnet50迁移学习,余弦退火学利率衰减算法,对数据集进行训练获得高识别率、高效率的模型;用MYSQL数据库和Pyside2搭建前端界面实现玉米四种病害八种状态的病害识别系统。测试表明:该系统对收集到... 本文基于计算机视觉,采用PyTorch框架,Resnet50迁移学习,余弦退火学利率衰减算法,对数据集进行训练获得高识别率、高效率的模型;用MYSQL数据库和Pyside2搭建前端界面实现玉米四种病害八种状态的病害识别系统。测试表明:该系统对收集到的西藏高原地区玉米种植的4种病害及病害程度的识别准确率达到81%以上,可实现用户上传病害图片或使用摄像头进行实时识别病害,并显示出该病害的相关简介和防止方法等一系列信息。该系统能够满足农业在识别防治玉米病害方面的需求。 展开更多
关键词 pytorch 病害识别 Resnet50 余弦退火 Pyside2
在线阅读 下载PDF
基于深度学习的蒙皮表面缺陷检测研究
16
作者 丁文浩 羊昌燕 陈善敏 《兵器装备工程学报》 CAS CSCD 北大核心 2022年第S02期361-367,共7页
采集大量蒙皮表面缺陷图像作为训练样本,在Faster RCNN网络和SSD网络的基础上设计缺陷检测网络。制定网络评价准则,通过查全率、查准率等技术指标全面衡量网络的可用性。利用高性能图形工作站对2种网络进行训练和测试,测试结果表明,2种... 采集大量蒙皮表面缺陷图像作为训练样本,在Faster RCNN网络和SSD网络的基础上设计缺陷检测网络。制定网络评价准则,通过查全率、查准率等技术指标全面衡量网络的可用性。利用高性能图形工作站对2种网络进行训练和测试,测试结果表明,2种网络均可以检测并识别典型缺陷,标识缺陷位置、类别和置信度。结果表明:基于2种基础网络的缺陷检测网络能检测并识别典型缺陷,相关技术指标达到预期水平。 展开更多
关键词 缺陷检测 深度学习 Faster RCNN SSD pytorch
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部