期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
基于“嵩山”超级计算机系统的大规模管网仿真 被引量:3
1
作者 杨周凡 韩林 +3 位作者 李冰洋 谢景明 韩璞 刘勇杰 《计算机工程》 CAS CSCD 北大核心 2022年第9期155-161,共7页
供水管网仿真广泛应用于城市供水输配调度,是城市供水管网监测与维护的重要技术手段。由于在面向城市级的大规模管网中产生了海量的计算数据,因此在一般计算平台上无法满足管网仿真计算的算力需求。为提升城市级供水管网仿真的计算效率... 供水管网仿真广泛应用于城市供水输配调度,是城市供水管网监测与维护的重要技术手段。由于在面向城市级的大规模管网中产生了海量的计算数据,因此在一般计算平台上无法满足管网仿真计算的算力需求。为提升城市级供水管网仿真的计算效率,提出一种有效的并行化方案。基于“嵩山”超级计算机系统采用中央处理器+数据缓存单元(CPU+DCU)架构,利用其在密集数据计算方面的优势,对“嵩山”超级计算机进行供水管网仿真。参照可移植性异构计算接口(HIP)异构编程模型,在“嵩山”超级计算机上实现供水管网仿真的异构计算,并结合管道数据分割方案,使用消息传递接口开启多进程以实现DCU加速数据通信传递。通过重定义数据类型解决计算过程中结构体传输问题,实现单节点内多DCU的大规模密集计算。在不同计算平台和多种计算策略仿真上的对比结果表明,与传统x86平台相比,该优化方案在小规模数据与大规模数据上的加速比分别达到5.269、10.760,与采用计算统一设备架构异构编程模型的传统GPU异构平台相比,计算性能有明显提高。 展开更多
关键词 中央处理器+数据缓存单元架构 数据缓存单元加速器 仿真计算 可移植性异构计算接口 消息传递接口
在线阅读 下载PDF
融合多源信息及图像特征泛化的空气质量检测
2
作者 王晓婷 崔雅博 刘丽娜 《电子测量技术》 北大核心 2025年第13期166-173,共8页
针对空气PM_(2.5)浓度检测过度依赖专业设备的问题,提出了一种融合多源信息及图像特征泛化的空气质量检测算法。首先采用EfficientNet-B0作为主干网络对输入的大气可见光图像进行特征编码,将温度、湿度、风速、气压和光照强度等多源气... 针对空气PM_(2.5)浓度检测过度依赖专业设备的问题,提出了一种融合多源信息及图像特征泛化的空气质量检测算法。首先采用EfficientNet-B0作为主干网络对输入的大气可见光图像进行特征编码,将温度、湿度、风速、气压和光照强度等多源气象信息映射为与大气图像对应的特征向量,并与大气图像特征进行拼接融合;然后利用全连接层将全局特征输出为标量,并利用损失函数检测出空气的PM_(2.5)浓度;最后在网络模型训练阶段,通过对大气图像不同尺度的特征进行随机泛化增强来丰富样本分布空间,使网络能够在有限的数据样本中学习到更多特征,从而有效改善了检测网络的性能。实验结果表明:设计的检测方法与几种主流的方法相比具有更高的检测精度和稳定性,在测试集上得到的RMSE和R-squared分别为21.55μg/m^(3)和0.923,通过对8个场景检测,得到结果的平均误差仅为5.2%,最大误差也仅为7.6%,能够适应各类极端大气污染环境的空气质量检测任务。 展开更多
关键词 空气质量 PM_(2.5)检测 卷积神经网络 多源信息 特征泛化增强 特征融合
在线阅读 下载PDF
面向DCU的流固耦合浸没边界算法异构实现
3
作者 商建东 熊威 +3 位作者 华浩波 宋昭璐 郭恒亮 张军 《计算机工程》 北大核心 2025年第7期263-274,共12页
直接力浸没边界法是求解流固耦合问题的常见方法之一,其可以有效地处理复杂的几何形状,包括移动和变形的固体。然而,三维复杂流动模拟具有网格规模大、耗时多的特点,在单核处理器上使用传统的串行算法往往无法满足计算要求。目前,在国... 直接力浸没边界法是求解流固耦合问题的常见方法之一,其可以有效地处理复杂的几何形状,包括移动和变形的固体。然而,三维复杂流动模拟具有网格规模大、耗时多的特点,在单核处理器上使用传统的串行算法往往无法满足计算要求。目前,在国产平台上对流固耦合问题的研究较少,而在国产平台上实现直接力浸没边界算法能够丰富平台的应用生态。为此,使用国产DCU(Deep Compute Unit)加速器,基于CPU-DCU异构编程,设计并实现利用三维直接力浸没边界算法求解流固耦合问题的并行程序。首先,在CPU上实现串行算法并进行热点分析,对程序热点部分使用DCU加速器进行异构加速;其次,在异构实现的基础上,结合DCU硬件特性,使用共享内存、循环分块、调整访存顺序等优化手段对核函数进行优化;最后,通过圆球绕流和仿生鱼自主游动算例对程序进行正确性验证和性能测试。实验结果表明,在雷诺数分别为100和200时,圆球的阻力系数分别为1.11和0.78,计算结果均与相关文献吻合;在雷诺数为7142的仿生鱼自主游动实验中,游动稳定后的平均前进速度为0.396,该结果与相关文献结果一致。在圆球绕流实验中,在5033万网格规模下该并行程序较串行程序获得了83.7倍的加速效果。通过两类流固耦合数值实验,验证了CPU-DCU并行直接力浸没边界算法在国产异构平台上进行计算的有效性和准确性,这为国产平台上CFD(Computational Fluid Dynamics)算法的研究提供了坚实基础。 展开更多
关键词 异构计算 DCU加速器件 访存优化 直接力浸没边界法 流固耦合
在线阅读 下载PDF
一种基于TVM的自动调度搜索优化方法
4
作者 韩林 王一帆 +1 位作者 李嘉楠 高伟 《计算机科学》 北大核心 2025年第3期268-276,共9页
随着人工智能的迅猛发展,新型算子与硬件不断涌现,算子库的开发和维护面临着巨大的挑战,仅仅依靠手工优化已无法满足AI模型性能提升的需求。Ansor是一种基于TVM的算子自动调度技术,可以针对不同的后端搜索深度学习模型或算子的最佳调度... 随着人工智能的迅猛发展,新型算子与硬件不断涌现,算子库的开发和维护面临着巨大的挑战,仅仅依靠手工优化已无法满足AI模型性能提升的需求。Ansor是一种基于TVM的算子自动调度技术,可以针对不同的后端搜索深度学习模型或算子的最佳调度方案,生成高性能代码而无需用户手动定义模板,但其巨大的搜索空间造成了搜索效率低下的问题。因此,提出了两种优化方案:1)基于强化学习的算法实现最佳性能草图的选择;2)基于机器学习模型的突变规则预测。两种优化方案旨在缩短最佳调度方案的搜索时间,快速生成高性能的算子。为评估优化方案的有效性,对Resnet-50等3种模型和conv2d等3种算子进行测试与评估。结果显示,优化后的Ansor只用70%~75%的搜索时间就可以生成性能与之前相同甚至更优的目标程序,并且在最佳迭代次数下,目标程序的推理速度最高可提升5%。 展开更多
关键词 自动调度 TVM编译器 搜索速度优化 机器学习 强化学习 深度学习模型
在线阅读 下载PDF
基于粒子群算法的自动向量化收益评估模型研究
5
作者 刘梦真 周清雷 +4 位作者 韩林 聂凯 李浩然 陈梦尧 刘浩浩 《计算机科学》 北大核心 2025年第7期248-254,共7页
自动向量化技术利用SIMD部件加速程序的执行,减轻了程序员的负担,是GCC编译器中的重要优化过程之一。但GCC编译器中自动向量化的收益评估模型并不准确,会影响GCC编译器是否应该进行向量化转换的判定。为了提升申威平台上的自动向量化效... 自动向量化技术利用SIMD部件加速程序的执行,减轻了程序员的负担,是GCC编译器中的重要优化过程之一。但GCC编译器中自动向量化的收益评估模型并不准确,会影响GCC编译器是否应该进行向量化转换的判定。为了提升申威平台上的自动向量化效率,基于申威平台上的GCC编译器,构建了一套新的自动向量化收益评估模型。针对申威处理器的后端指令集设计不同种类的代价,通过粒子群算法训练相对应的代价值,以提高申威平台上自动向量化收益评估模型的准确性。在SPEC2006和SPEC2017上进行了实验测试,与GCC编译器默认的收益评估模型相比,所提模型在SPEC2006课题上加速比最高提升7.6%,在SPEC2017课题上加速比最高提升5.75%,验证了模型的有效性。实验结果表明,所提出的模型可进一步完善基础自动向量化功能,提升申威平台编译系统的易用性。 展开更多
关键词 申威平台 GCC编译器 自动向量化 收益评估模型 粒子群算法
在线阅读 下载PDF
一种基于指令MKS的自动向量化代价模型 被引量:1
6
作者 王震 聂凯 韩林 《计算机科学》 CSCD 北大核心 2024年第4期78-85,共8页
自动向量化代价模型是编译器进行自动向量化优化时的重要组成部分,其作用是评估代码在应用向量化转换后能否获得性能提升。当代价模型不准确时,编译器会应用负收益的向量化转换,从而降低程序的执行效率。针对GCC编译器默认代价模型的不... 自动向量化代价模型是编译器进行自动向量化优化时的重要组成部分,其作用是评估代码在应用向量化转换后能否获得性能提升。当代价模型不准确时,编译器会应用负收益的向量化转换,从而降低程序的执行效率。针对GCC编译器默认代价模型的不精确问题,以Intel Xeon Silver 4214R CPU为平台,提出了一种基于指令MKS的自动向量化代价模型。该模型充分考虑了指令的机器模式、运算类型以及运算强度等,并使用梯度下降算法自动搜索不同指令类型的近似代价。在SPEC2006以及SPEC2017上进行了单线程测试,实验结果表明,该模型能够减少收益评估错误的情况。与默认代价模型生成的向量程序相比,GCC编译器添加MKS代价模型后,在SPEC2006课题上最高获得了4.72%的提速,在SPEC2017课题上最高获得了7.08%的提速。 展开更多
关键词 GCC编译器 自动向量化 代价模型 收益评估 梯度下降
在线阅读 下载PDF
一种基于TVM的算子生成加速策略
7
作者 高伟 李帅龙 +3 位作者 茆琳 王磊 李颖颖 韩林 《计算机工程》 CAS CSCD 北大核心 2024年第8期353-362,共10页
随着人工智能(AI)的飞速发展,新算子和底层硬件层出不穷,这给算子库的开发和维护带来了巨大的工作量。单纯基于手工优化来解决AI模型的性能和效率很容易出现瓶颈。TVM深度学习编译器通过代码的自动化生成减轻了手工优化的负担,但同时也... 随着人工智能(AI)的飞速发展,新算子和底层硬件层出不穷,这给算子库的开发和维护带来了巨大的工作量。单纯基于手工优化来解决AI模型的性能和效率很容易出现瓶颈。TVM深度学习编译器通过代码的自动化生成减轻了手工优化的负担,但同时也存在搜索时间长的问题。为此,针对TVM的自动化代码生成框架Ansor,提出基于梯度提升算法的新代价模型和基于预定义规则的调度空间剪枝优化2种优化策略,旨在加速TVM的自动化代码生成过程,实现模型快速落地与部署,并进一步为人工智能技术的应用提供更高效的解决方案。实验结果表明,通过应用优化后代价模型可以在不损失推理时间的前提下,使得在x86 CPU平台上模型的调优时间减少30%~35%,同时优化后算子性能最高可提升22%,使得在深度计算单元(DCU)平台上模型的调优时间减少20%左右,同时优化后算子平均性能提升5.7%,此外,基于预定义规则的剪枝策略可以有效提升代价模型的收敛速度,并且在原有最佳迭代次数下,模型推理时间可提高7.4%。 展开更多
关键词 深度学习编译器 代价模型 梯度提升算法 剪枝策略 自动调优
在线阅读 下载PDF
机器学习结合压入技术检测金属表面残余应力
8
作者 徐广涛 刘少帅 +3 位作者 赵金涛 郇培 刘海涛 韩光照 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第11期98-105,共8页
为丰富和发展机制清楚、分析可靠的金属材料表面残余应力压入检测技术,开展了不同工况下圆锥压入有限元仿真,基于量纲分析法,分别结合反向传播(BP)和多层感知器(MLP)神经网络技术,建立了关联压入加载曲率与材料塑性参数、残余应力的映... 为丰富和发展机制清楚、分析可靠的金属材料表面残余应力压入检测技术,开展了不同工况下圆锥压入有限元仿真,基于量纲分析法,分别结合反向传播(BP)和多层感知器(MLP)神经网络技术,建立了关联压入加载曲率与材料塑性参数、残余应力的映射网络,在此基础上提出了材料表面残余应力的仪器化压入检测方法。通过仿真数据集训练的BP及MLP神经网络预测结果与仿真预设的残余应力吻合良好,且BP神经网络的预测结果精度较优。对引入不同程度残余应力的18CrNiMo7-6合金钢薄片试样开展仪器化压入试验,借助已报道的3种金属材料锥压入试验数据,验证检测方法的可靠性。结果表明,基于BP和MLP神经网络预测的残余应力结果与试验预施加应力之间的误差普遍在40 MPa以内。 展开更多
关键词 神经网络 残余应力 仪器化压入 有限元仿真
在线阅读 下载PDF
分布式高性能自组网节点技术研究 被引量:4
9
作者 于哲 周舜民 +4 位作者 王彬 孙艺铭 陈方 赵子龙 李贝贝 《现代电子技术》 北大核心 2024年第5期1-7,共7页
针对当前主流Mesh自组网技术节点传输带宽不足百兆,级跳数小于10的问题,提出采用多处理器构建实现分布式多跳、高带宽低时延的无线跳频的高性能自组网节点,对节点自动化组网连接、多信道选择避让、漫游切换及低时延高带宽网络多跳实现... 针对当前主流Mesh自组网技术节点传输带宽不足百兆,级跳数小于10的问题,提出采用多处理器构建实现分布式多跳、高带宽低时延的无线跳频的高性能自组网节点,对节点自动化组网连接、多信道选择避让、漫游切换及低时延高带宽网络多跳实现等关键技术进行研究实现。由测试结果分析可知,在20级跳内,文中节点组网带宽损失在30%以内且带宽保持在200 Mb/s以上,时延控制在100 ms内,可以满足现实应急场景下多终端智能硬件实时进行图像、视频等大数据量信息交互对高带宽低时延网络通信的需求。 展开更多
关键词 多处理器 自组网连接 多级跳 高带宽 低时延 信息交互
在线阅读 下载PDF
ARP欺骗攻击与硬件防御研究 被引量:2
10
作者 何开宇 王彬 +1 位作者 于哲 陈方 《信息网络安全》 CSCD 北大核心 2024年第10期1604-1610,共7页
针对现有ARP欺骗攻击防御手段配置繁琐、成本高昂等问题,文章设计了基于FPGA的硬件防御设备并在真实网络环境中进行了测试。首先搭建真实的局域网环境,利用arpspoof工具对局域网中的目标主机实施ARP欺骗攻击;然后设计了基于FPGA平台的... 针对现有ARP欺骗攻击防御手段配置繁琐、成本高昂等问题,文章设计了基于FPGA的硬件防御设备并在真实网络环境中进行了测试。首先搭建真实的局域网环境,利用arpspoof工具对局域网中的目标主机实施ARP欺骗攻击;然后设计了基于FPGA平台的网络安全防御设备,通过对上下行链路中的网络报文进行解析,并与设置的安全防御策略相应报文的字段进行比对过滤,实现对ARP欺骗报文的识别与过滤;最后将网络安全防御设备接入局域网,并通过VIVADO的ILA抓取ARP欺骗攻击报文的相关字段波形。波形数据表明,网络安全防御设备可有效识别ARP欺骗攻击报文的MAC地址和IP地址等内容并实施有效拦截,同时可对接入系统的网络链路带宽、攻击拦截率和被攻击主机系统资源使用率进行统计。 展开更多
关键词 网络安全 地址解析协议 欺骗攻击 FPGA 硬件防御
在线阅读 下载PDF
基于高速安全存储SoC芯片的PCIe与SATA通路验证 被引量:2
11
作者 于哲 周舜民 陈方 《计算机应用研究》 CSCD 北大核心 2024年第5期1496-1501,共6页
针对传统SATA控制器存储系统性能受限、安全性不足问题,提出并设计了一款可实现PCIe(peripheral component interconnect express)与SATA(serial advanced technology attachment)协议传输数据互转,基于SM4算法实现本地数据安全存储的... 针对传统SATA控制器存储系统性能受限、安全性不足问题,提出并设计了一款可实现PCIe(peripheral component interconnect express)与SATA(serial advanced technology attachment)协议传输数据互转,基于SM4算法实现本地数据安全存储的高速安全存储SoC(system of chip)芯片。通过构建合理的片内PCIe与SATA互转数据传输通路,利用PCIe VIP(verification intellectual property)及UVM(universal verification methodology)技术搭建系统应用级仿真验证平台,设计基于SystemVerilog语言的源激励用例和C固件,利用脚本自动化控制实现仿真验证。仿真结果表明,该SoC芯片通路上各设备链路建立正确,实现PCIe与SATA互转通路数据正确传输,测试带宽472 MBps,基于SM4算法的本地安全存储加解密无误,SM4算法加解密带宽1.33 Gbps。根据仿真实验结果可知,该PCIe与SATA桥接转换SoC芯片架构设计是可行的,实现了本地数据的安全存储,为进一步进行数据高速转换访问、安全传输存储研究奠定了重要基础。 展开更多
关键词 PCIe与SATA互转 PCIe VIP UVM C固件
在线阅读 下载PDF
基于MLIR的FP8量化模拟与推理内存优化
12
作者 徐金龙 桂中华 +2 位作者 李嘉楠 李颖颖 韩林 《计算机科学》 CSCD 北大核心 2024年第9期112-120,共9页
随着目标检测模型和语言大模型的迅速发展,网络模型正变得越来越庞大。为了更好地在端侧硬件上进行模型部署,通常采用模型量化技术对模型进行压缩。现有的模型量化策略主要基于FP16,BF16和INT8等类型实现。其中,8bit数据类型在降低推理... 随着目标检测模型和语言大模型的迅速发展,网络模型正变得越来越庞大。为了更好地在端侧硬件上进行模型部署,通常采用模型量化技术对模型进行压缩。现有的模型量化策略主要基于FP16,BF16和INT8等类型实现。其中,8bit数据类型在降低推理内存占用与部署开销方面最为显著,但INT8类型依赖特定的校准算法,未能很好地处理动态范围大、离群点多的模型。FP8类型能够更好地拟合神经网络中的数据分布,同时具有多种数制,可在表达范围和表达精度上灵活调整。然而,当前MLIR系统缺乏对FP8类型量化的支持。为此,提出了一种基于MLIR系统的FP8量化模拟策略,包含FP8E4M3和FP8E5M2两种数制,通过对网络中的算子进行量化模拟,评估FP8两种数制对模型推理精度的影响。同时,针对推理引擎中存在的内存分配冗余问题,提出了一种基于定义使用链的内存复用策略,使得模型推理过程中的内存占用峰值进一步减小。实验选取了典型的Yolov5s和Resnet50模型进行测试,结果表明相较于现有的INT8量化策略,FP8量化策略能够保持更好的模型精度,同时不依赖特定校准算法,部署更为简便。在模型精度上,测试用例分别达到了55.5%和77.8%的准确度,经过内存复用优化,内存占用峰值降低了约15%~20%。 展开更多
关键词 模型压缩 深度学习编译器 FP8量化 MLIR Yolov5s模型
在线阅读 下载PDF
基于数据局部性的循环分块选择算法
13
作者 廖启华 聂凯 +2 位作者 韩林 陈梦尧 谢汶兵 《计算机科学》 CSCD 北大核心 2024年第12期100-109,共10页
现有的多面体编译框架(如Pluto,LLVM/Polly和GCC/Graphite)在进行循环分块时,都采用了固定分块大小,无法充分发挥不同硬件的缓存特性,导致存在较大的性能差异。针对这一问题,涌现了许多基于多级缓存和数据局部性的循环分块算法,但这些... 现有的多面体编译框架(如Pluto,LLVM/Polly和GCC/Graphite)在进行循环分块时,都采用了固定分块大小,无法充分发挥不同硬件的缓存特性,导致存在较大的性能差异。针对这一问题,涌现了许多基于多级缓存和数据局部性的循环分块算法,但这些算法往往只能优化特定循环程序或者缺乏综合考虑,不适合移植到通用编译器中。文中提出了一种基于数据局部性的循环分块选择算法,该算法不仅考虑了缓存替换策略的影响,还考虑了多核环境下的负载均衡问题。算法基于LLVM中的Polly模块实现,并选用Pluto和PolyBench中的部分测试用例进行单核和多核测试。实验结果表明,单核环境下,相比LLVM/Polly的默认分块方法,该算法在两种硬件平台下分别获得了平均2.03和2.05的加速比,且在多核环境下具有良好的并行可扩展性。 展开更多
关键词 数据局部性 多面体模型 循环分块 分块大小 负载均衡
在线阅读 下载PDF
晶硅分子动力学模拟的GPU加速算法优化 被引量:3
14
作者 林琳 祝爱琦 +6 位作者 赵明璨 张帅 叶炎昊 徐骥 韩林 赵荣彩 侯超峰 《计算机工程》 CAS CSCD 北大核心 2023年第4期166-173,共8页
分子动力学(MD)模拟是研究硅纳米薄膜热力学性质的主要方法,但存在数据处理量大、计算密集、原子间作用模型复杂等问题,限制了MD模拟的深入应用。针对晶硅分子动力学模拟算法中数据访问不连续和大量分支判断造成并行资源浪费、线程等待... 分子动力学(MD)模拟是研究硅纳米薄膜热力学性质的主要方法,但存在数据处理量大、计算密集、原子间作用模型复杂等问题,限制了MD模拟的深入应用。针对晶硅分子动力学模拟算法中数据访问不连续和大量分支判断造成并行资源浪费、线程等待等问题,结合Nvidia Tesla V100 GPU硬件体系结构特点,对晶硅MD模拟算法进行设计。通过全局内存的合并访存、循环展开、原子操作等优化方法,利用GPU强大并行计算和浮点运算能力,减少显存访问及算法执行过程中的分支冲突和判断指令,提升算法整体计算性能。测试结果表明,优化后的晶硅MD模拟算法的计算速度相比于优化前提升了1.69~1.97倍,相比于国际上主流的GPU加速MD模拟软件HOOMDblue和LAMMPS分别提升了3.20~3.47倍和17.40~38.04倍,具有较好的模拟加速效果。 展开更多
关键词 分子动力学 图形处理器 合并访存 循环展开 原子操作 性能优化
在线阅读 下载PDF
基于人工蜂群算法的多维函数优化加速方法 被引量:6
15
作者 李辉 韩林 +1 位作者 于哲 王威 《计算机科学》 CSCD 北大核心 2022年第S02期926-931,共6页
人工蜂群算法在农业农村大数据应用开发中被广泛采用,但是串行人工蜂群算法时间的复杂度较高,不适用于多维函数的快速求解问题。针对串行人工蜂群算法对多维函数求解执行效率较低的问题进行分析,通过解析多维函数及人工依赖关系判定,提... 人工蜂群算法在农业农村大数据应用开发中被广泛采用,但是串行人工蜂群算法时间的复杂度较高,不适用于多维函数的快速求解问题。针对串行人工蜂群算法对多维函数求解执行效率较低的问题进行分析,通过解析多维函数及人工依赖关系判定,提出了一种基于人工蜂群算法的多维函数优化加速方法,该方法包括任务划分、数据分布、同步操作和任务并行。为了证明方法的有效性,以海光处理器为硬件测试平台,对4个多维函数进行对比测试。实验结果表明,与串行人工蜂群算法对多维函数的求解速度相比,该方法对于4个多维函数的求解速度能得到大幅提升。 展开更多
关键词 大数据 人工蜂群算法 多维函数 ROCm HIP模型 海光处理器
在线阅读 下载PDF
基于GPU的固态晶体硅分子动力学算法优化 被引量:1
16
作者 李靖 祝爱琦 +1 位作者 韩林 侯超峰 《计算机工程》 CAS CSCD 北大核心 2023年第3期288-295,共8页
分子动力学模拟通常用于晶体硅热力学性质的研究,因原子间采用复杂的多体作用势,分子模拟通常面临较高的计算负载,导致计算的时间和空间尺度受限。图形处理器(GPU)采用并行多线程技术,用于计算密集型处理任务,在分子动力学模拟领域中显... 分子动力学模拟通常用于晶体硅热力学性质的研究,因原子间采用复杂的多体作用势,分子模拟通常面临较高的计算负载,导致计算的时间和空间尺度受限。图形处理器(GPU)采用并行多线程技术,用于计算密集型处理任务,在分子动力学模拟领域中显示巨大的应用潜力。因此,充分利用GPU硬件架构特性提升固态共价晶体硅分子动力学模拟的时空尺度对晶体硅导热机制的研究具有重要意义。基于固态共价晶体硅分子动力学模拟算法,提出面向GPU计算平台的固定邻居算法设计与优化。利用数据结构、分支结构优化等方法解决分子动力学模拟的固定邻居算法全局访存和分支结构的耗时问题,降低数据访存消耗和分支冲突,通过改变线程并行调度方式,在GPU计算平台上实现高性能并行计算,有效解决计算负载问题。实验结果表明,LAMMPS双精度固态晶体硅分子动力学模拟与双精度固定邻居算法的加速比为11.62,HOOMD-blue双精度固态晶体硅分子动力学模拟与双精度固定邻居算法和单精度固定邻居算法的加速比分别为9.39和12.18。 展开更多
关键词 分子动力学模拟 图形处理器 固定邻居 数据结构 分支结构
在线阅读 下载PDF
微生态修复南瓜种植环境防治根结线虫病研究 被引量:2
17
作者 陈继峰 王晶晶 +9 位作者 刘洪源 马力 张晓雨 周艺凯 李贝贝 钟贤宇 孙佳宁 刘文狄 刘立煌 马双武 《现代农业科技》 2021年第19期115-117,123,共4页
为了探索环境有益菌菌株对根结线虫的影响,利用M-43、M-01、Y8和Y1环境有益菌的固体菌剂进行土壤微生态修复抑制瓜类根结线虫试验。结果表明,各处理对南瓜根结线虫的抑制效果非常明显,并且对南瓜植株有很好的促长与提高产量的作用。其中... 为了探索环境有益菌菌株对根结线虫的影响,利用M-43、M-01、Y8和Y1环境有益菌的固体菌剂进行土壤微生态修复抑制瓜类根结线虫试验。结果表明,各处理对南瓜根结线虫的抑制效果非常明显,并且对南瓜植株有很好的促长与提高产量的作用。其中,Y1+Y8、Y1菌株的固体菌剂效果最好,南瓜根系上根结数较对照减少70%~80%,土壤中线虫数量较对照减少90%。当Y1+Y8、Y1菌剂中环境有益菌的发酵液直接作用于2日龄根结线虫24 h,根结线虫的死亡率达100%。Y1+Y8和Y1环境有益菌微生物固体菌剂能很好地改善瓜类种植环境,修复土壤微生态系统,促进南瓜生长,有望进一步在保护地栽培瓜果、蔬菜上用于防治根结线虫病发生。 展开更多
关键词 南瓜 根结线虫 微生态修复 环境有益菌
在线阅读 下载PDF
基于Faster R-CNN的肺炎目标检测 被引量:5
18
作者 宋雯琦 赵荣彩 +1 位作者 姜旭 刘艳青 《计算机工程与设计》 北大核心 2023年第7期2087-2092,共6页
针对肺炎图像中病灶组织与正常组织难以区分,导致的肺炎检测准确率低的问题,提出一种基于改进Faster R-CNN的肺炎目标检测算法。通过CRP-CLAHELS的流程在增强图像对比度的同时提取图像的边缘特征,提出IN-ResNet50网络作为特征提取主干网... 针对肺炎图像中病灶组织与正常组织难以区分,导致的肺炎检测准确率低的问题,提出一种基于改进Faster R-CNN的肺炎目标检测算法。通过CRP-CLAHELS的流程在增强图像对比度的同时提取图像的边缘特征,提出IN-ResNet50网络作为特征提取主干网络,提取更丰富的图像特征。在此基础上,引入Soft-NMS改进候选框合并策略,提高网络在多个目标肺炎区域下的检测准确率。在RSNA数据集上的实验结果表明,该算法相比Faster R-CNN平均精度均值提高7.26%,与其它目标检测主流算法SSD、YOLOv3相比平均精度均值分别提高8.83%、7.02%,验证了其有效性。 展开更多
关键词 深度学习 肺炎检测 快速区域卷积神经网络 医学图像处理 限制对比度自适应直方图均衡化 目标检测 非极大值抑制
在线阅读 下载PDF
基于SPEI的长江流域干旱特征及其驱动因素分析 被引量:4
19
作者 商建东 王芷晓 +1 位作者 魏洁茹 魏冲 《华北水利水电大学学报(自然科学版)》 北大核心 2023年第6期36-48,共13页
基于长江流域114个气象站的1980—2019年逐月气象数据,计算多尺度标准化降水蒸散指数(SPEI),使用干旱覆盖面积占比分析、Sen+Mann-Kendall趋势检验分析、干旱重心转移模型以及地理探测器等,对长江流域干旱特征及其驱动因素进行分析。结... 基于长江流域114个气象站的1980—2019年逐月气象数据,计算多尺度标准化降水蒸散指数(SPEI),使用干旱覆盖面积占比分析、Sen+Mann-Kendall趋势检验分析、干旱重心转移模型以及地理探测器等,对长江流域干旱特征及其驱动因素进行分析。结果表明:①长江流域总体呈变湿趋势,SPEI值整体以0.01/(10年)的速率上升。各时间尺度SPEI值均在(-1,1)区间取值,呈明显正负波动趋势。干旱等级以无旱和轻旱为主,其中春夏两季呈湿润趋势,秋冬两季呈干旱趋势。②长江流域在2010年代冬季发生干旱面积最大,主要集中在中部地区。③干旱重心迁移方向逐渐向长江流域中下游移动。④气象和地形地貌为长江流域干旱变化的主要影响因素,其中年均降水和高程因子占据主导地位。双因子交互作用对长江流域的干旱变化影响大于单因子作用的,说明长江流域的干旱差异是多因子组合作用的结果。 展开更多
关键词 干旱特征 标准化降水蒸散指数 时空变化 地理探测器 长江流域
在线阅读 下载PDF
青藏高原多尔索洞错水深反演与水量变化估算
20
作者 崔剑 乔宝晋 +1 位作者 郭恒亮 杨洪 《人民长江》 2024年第4期142-149,共8页
利用由实测水深空间插值获得的水下地形数据估算湖泊水量及其变化往往存在较大误差。以Landsat系列影像数据及多尔索洞错12 m以下实测水深数据为基础,建立多波段组合模型进行水深模拟,结合多时相Landsat影像获取的多尔索洞错边界数据获... 利用由实测水深空间插值获得的水下地形数据估算湖泊水量及其变化往往存在较大误差。以Landsat系列影像数据及多尔索洞错12 m以下实测水深数据为基础,建立多波段组合模型进行水深模拟,结合多时相Landsat影像获取的多尔索洞错边界数据获取水深变化,估算1996~2016年多尔索洞错水量变化。实验结果表明:多因子反演模型的相关系数(R^(2))均在0.90以上,平均绝对误差低至0.48 m,相比空间插值方法能更精确地模拟多尔索洞错水深在12 m以下区域的水深分布情况;近20 a来多尔索洞错不断扩张,水位升高约0.40 m/a,水量增加约0.18 km^(3)/a。 展开更多
关键词 水深反演 水量变化 归一化水体指数法(NDWI) 多波段组合模型 多尔索洞错
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部