期刊文献+
共找到57篇文章
< 1 2 3 >
每页显示 20 50 100
暗态势计算:概念、方法与应用
1
作者 李超超 程兰惠 +4 位作者 杨赛赛 吕培 葛昭阳 王华 徐明亮 《计算机辅助设计与图形学学报》 北大核心 2025年第4期568-582,共15页
态势感知指对环境元素的感知、理解和预测,为高层决策提供支撑.态势信息的全面获取能够有效地提高态势感知的准确性.针对态势信息不直观、态势获取不全面的问题,提出“暗态势计算”概念,辅助人类挖掘、感知全面态势信息.首先,介绍暗态... 态势感知指对环境元素的感知、理解和预测,为高层决策提供支撑.态势信息的全面获取能够有效地提高态势感知的准确性.针对态势信息不直观、态势获取不全面的问题,提出“暗态势计算”概念,辅助人类挖掘、感知全面态势信息.首先,介绍暗态势计算的内涵和优势,并给出理论支撑;然后,充分地利用增强现实技术,以生动直观的呈现方式、沉浸式智能交互、虚实叠加等诸多优势,设计基于增强现实的人机物虚实融合暗态势计算框架,基于增强现实技术将机器的计算能力和人的认知能力结合,通过“虚实融合观察—沉浸式交互—全面分析预测”循环迭代过程实现暗态势计算;最后,以基于航母航空保障作业的半实物电子沙盘推演系统为例,阐述暗态势计算的应用.实验结果表明,所提方法的决策结果优于基于传统态势感知的决策结果,验证了该方法的合理性及优势. 展开更多
关键词 暗态势 态势感知 增强现实 态势预测 人机协同
在线阅读 下载PDF
Grover量子搜索算法在“嵩山”超级计算机系统中的模拟 被引量:1
2
作者 杜帅岐 刘晓楠 +1 位作者 廉德萌 刘正煜 《计算机科学》 CSCD 北大核心 2024年第9期96-102,共7页
量子计算凭借其叠加性和纠缠性,具有强大的并行计算能力。然而,目前的量子计算机不能在保证大规模量子比特处于稳定叠加态的同时,进行干涉、纠缠等量子操作。因此,当前研究和推动量子计算的有效途径是使用经典计算机模拟量子计算。Grove... 量子计算凭借其叠加性和纠缠性,具有强大的并行计算能力。然而,目前的量子计算机不能在保证大规模量子比特处于稳定叠加态的同时,进行干涉、纠缠等量子操作。因此,当前研究和推动量子计算的有效途径是使用经典计算机模拟量子计算。Grover量子搜索算法针对无序数据库搜索问题设计,将搜索的时间复杂度加速至开平方级,能加速机器学习中的主成分分析。因此,研究和模拟Grover算法,可以促进量子计算与机器学习结合领域的发展,为Grover量子搜索算法的应用以及量子机器学习在“嵩山”超级计算机系统中的模拟奠定基础。通过研究Grover量子搜索算法,模拟出了算法的量子线路。使用Toffoli量子门优化该量子线路,在减少了两个辅助量子比特的同时,提出了Grover算法的通用量子线路。实验基于“嵩山”超级计算机系统的CPU+DCU异构体系,使用了MPI多进程+HIP多线程的两级并行策略。通过调整辅助比特在量子线路中的位置,减少了MPI进程间的通信;使用分片的方式传输数据依赖的量子态。对比串行版本,并行化的模拟算法取得了最高560.33倍的加速,首次实现了31qubits规模的Grover量子搜索算法。 展开更多
关键词 GROVER量子搜索算法 异构体系 MPI HIP 分片传输
在线阅读 下载PDF
基于“嵩山”超级计算机系统的大规模管网仿真 被引量:3
3
作者 杨周凡 韩林 +3 位作者 李冰洋 谢景明 韩璞 刘勇杰 《计算机工程》 CAS CSCD 北大核心 2022年第9期155-161,共7页
供水管网仿真广泛应用于城市供水输配调度,是城市供水管网监测与维护的重要技术手段。由于在面向城市级的大规模管网中产生了海量的计算数据,因此在一般计算平台上无法满足管网仿真计算的算力需求。为提升城市级供水管网仿真的计算效率... 供水管网仿真广泛应用于城市供水输配调度,是城市供水管网监测与维护的重要技术手段。由于在面向城市级的大规模管网中产生了海量的计算数据,因此在一般计算平台上无法满足管网仿真计算的算力需求。为提升城市级供水管网仿真的计算效率,提出一种有效的并行化方案。基于“嵩山”超级计算机系统采用中央处理器+数据缓存单元(CPU+DCU)架构,利用其在密集数据计算方面的优势,对“嵩山”超级计算机进行供水管网仿真。参照可移植性异构计算接口(HIP)异构编程模型,在“嵩山”超级计算机上实现供水管网仿真的异构计算,并结合管道数据分割方案,使用消息传递接口开启多进程以实现DCU加速数据通信传递。通过重定义数据类型解决计算过程中结构体传输问题,实现单节点内多DCU的大规模密集计算。在不同计算平台和多种计算策略仿真上的对比结果表明,与传统x86平台相比,该优化方案在小规模数据与大规模数据上的加速比分别达到5.269、10.760,与采用计算统一设备架构异构编程模型的传统GPU异构平台相比,计算性能有明显提高。 展开更多
关键词 中央处理器+数据缓存单元架构 数据缓存单元加速器 仿真计算 可移植性异构计算接口 消息传递接口
在线阅读 下载PDF
面向国产超算平台的通用能源管网仿真计算模型 被引量:1
4
作者 韩璞 商建东 +3 位作者 薛飞 谢景明 王洪生 王海 《计算机应用研究》 CSCD 北大核心 2024年第3期866-872,共7页
为实现城市能源管网仿真软件的自主可控,基于国产异构高性能计算机“嵩山”超级计算平台,提出一种通用的城市能源管网仿真计算模型。通过优化管网中“非管”组件模型,提高了计算模型对国产异构并行计算机系统的适配性;将不同管网组件的... 为实现城市能源管网仿真软件的自主可控,基于国产异构高性能计算机“嵩山”超级计算平台,提出一种通用的城市能源管网仿真计算模型。通过优化管网中“非管”组件模型,提高了计算模型对国产异构并行计算机系统的适配性;将不同管网组件的计算过程进行封装,弱化了网络组件在仿真计算过程的依赖性,提升模型在工程实现上的可并行性。供水、燃气和热力三种场景的并行仿真实验,证明了计算模型在解决城市能源供给网络的仿真计算上具有一定的普适性;通过管网实测数据与仿真模型中模拟数据对比结果表明仿真管网压力的误差率在4%以下,其温度的误差率低于2%,同时也说明了提出的管网仿真计算模型在国产超算平台上具有良好的计算通用性。 展开更多
关键词 异构计算 能源管网 仿真模型 流体网络 并行计算
在线阅读 下载PDF
SDENet:基于多尺度注意力质量感知的合成缺陷数据评价网络 被引量:2
5
作者 卢洋 陈林慧 +1 位作者 姜晓恒 徐明亮 《图学学报》 北大核心 2025年第1期94-103,共10页
通过对数据扩增方式合成的缺陷数据进行质量评估,有助于实现缺陷数据高质量扩充,进而缓解缺陷数据不足导致的检测模型性能不佳问题。针对现有质量评价算法在评估合成缺陷数据质量时更关注数据的失真特性而忽略了对数据缺陷属性考量的问... 通过对数据扩增方式合成的缺陷数据进行质量评估,有助于实现缺陷数据高质量扩充,进而缓解缺陷数据不足导致的检测模型性能不佳问题。针对现有质量评价算法在评估合成缺陷数据质量时更关注数据的失真特性而忽略了对数据缺陷属性考量的问题,提出一种基于注意力特征增强(AFE)和多尺度注意力质量感知(MAQP)的模型SDENet,综合考虑数据的失真特性和缺陷属性进行质量评价。首先,AFE通过双分支池化操作提高模型对不同尺寸、位置缺陷的泛化能力,并结合注意力机制增强模型对特征的表达。其次,MAQP对AFE增强后的特征进行向量化与融合处理,以更好地感知合成缺陷数据质量。最后,对融合后的特征进行质量评估,得到最终的评估分数。在构建的合成道路裂缝缺陷数据集上进行实验,结果表明,SDENet模型在RMSE,RMAE,PLCC和SROCC指标上均取得最优结果,比次优模型依次提升10.7%,5.0%,1.8%和1.8%,验证了模型的有效性。在失真数据集TID2013上,SDENet模型也取得较有竞争的结果,在PLCC和SROCC指标上依次达到0.902和0.876。 展开更多
关键词 注意力机制 特征增强 特征融合 合成缺陷数据 质量评价
在线阅读 下载PDF
基于多粒度声呐图像匹配的水下定位方法
6
作者 王可 王振鹤 +4 位作者 王彪 刘攀第 王华 李佳欣 徐明亮 《舰船科学技术》 北大核心 2025年第14期95-102,共8页
针对水下地形匹配定位问题,提出一种基于多粒度声呐图像匹配的定位方法。构建了U-Net架构的图像特征抽取模型,以无监督方式抽取水下声呐图像的高层特征。设计了一种具有时空约束的多粒度匹配算法,在特征空间内首先进行粗粒度匹配,并结... 针对水下地形匹配定位问题,提出一种基于多粒度声呐图像匹配的定位方法。构建了U-Net架构的图像特征抽取模型,以无监督方式抽取水下声呐图像的高层特征。设计了一种具有时空约束的多粒度匹配算法,在特征空间内首先进行粗粒度匹配,并结合时空约束约简搜索空间,然后进行细粒度精确匹配,根据匹配结果实现水下定位。通过建模水下典型地形并进行模拟声呐探测构建了数据集,包括水下地形高程数据和对应的声呐探测图像。在自构数据集上的实验结果表明,所提方法的定位精度可达0.679 m,平均单次定位时长小于0.5 s,性能优于基线算法。 展开更多
关键词 水下定位 声呐图像 特征匹配 图像检索 多粒度
在线阅读 下载PDF
基于坐标注意力和加权双向特征金字塔网络的舰载机阻拦着舰拉制状态精准识别
7
作者 李哲 杨杰 +4 位作者 张椅 王华 李亚飞 王可 徐明亮 《中国舰船研究》 北大核心 2025年第4期124-133,共10页
[目的]舰载机着舰安全的关键在于尾钩与阻拦索成功挂索,而现有研究中,借助智能化手段辅助着舰指挥官(LSO)识别阻拦着舰状态的工作较少。为此,提出一种融合坐标注意力和加权双向特征金字塔网络的阻拦着舰拉制状态识别模型。[方法]先使用... [目的]舰载机着舰安全的关键在于尾钩与阻拦索成功挂索,而现有研究中,借助智能化手段辅助着舰指挥官(LSO)识别阻拦着舰状态的工作较少。为此,提出一种融合坐标注意力和加权双向特征金字塔网络的阻拦着舰拉制状态识别模型。[方法]先使用坐标注意力机制(CA)从空间和通道两个维度增强模型捕捉特征的能力;再通过加权双向特征金字塔网络(BiFPN)纳入可学习的权值学习不同输入特征的重要性,实现双向多尺度特征融合;然后采用C2F模块轻量化模型架构,减少参数和计算量;最后通过仿真实验将所提模型与5种基线模型进行对比。[结果]结果表明,在舰载机尾钩和阻拦着舰拉制状态的检测上,该模型综合性能均优于基线模型。[结论]该模型有助于提高尾钩及阻拦索的啮合状态检测的准确率和鲁棒性,对提高舰载机着舰作业的效率、预防潜在的人员伤害和装备损失具有重要意义。 展开更多
关键词 舰载机 阻拦装置 状态识别 双向特征金字塔网络(BiFPN) 航空母舰
在线阅读 下载PDF
基于自适应特征增强和融合的舰载机着舰拉制状态识别
8
作者 王可 刘奕阳 +3 位作者 杨杰 鲁爱国 李哲 徐明亮 《上海交通大学学报》 北大核心 2025年第2期274-282,共9页
拉制状态识别能辅助着舰信号官及时准确地形成后续指挥决策,是舰载机着舰引导的重要环节.提出一种基于自适应特征增强和融合的拉制状态识别方法,包含基于注意力机制的特征增强模块,通过分割特征图、串联空间域和通道域增强视觉表征能力... 拉制状态识别能辅助着舰信号官及时准确地形成后续指挥决策,是舰载机着舰引导的重要环节.提出一种基于自适应特征增强和融合的拉制状态识别方法,包含基于注意力机制的特征增强模块,通过分割特征图、串联空间域和通道域增强视觉表征能力;利用多尺度特征融合模块,将高分辨率浅层特征与语义信息丰富的深层特征进行融合,充分利用上下文语义信息.基于所提方法,设计基于可穿戴增强现实设备的着舰拉制状态识别原型系统;构建着舰作业虚实融合数据集以评估方法性能.结果表明,所提算法综合性能优于基线算法,能满足拉制状态识别的应用需求. 展开更多
关键词 舰载机 阻拦着舰 特征融合 注意力机制 状态识别
在线阅读 下载PDF
融合多源信息及图像特征泛化的空气质量检测
9
作者 王晓婷 崔雅博 刘丽娜 《电子测量技术》 北大核心 2025年第13期166-173,共8页
针对空气PM_(2.5)浓度检测过度依赖专业设备的问题,提出了一种融合多源信息及图像特征泛化的空气质量检测算法。首先采用EfficientNet-B0作为主干网络对输入的大气可见光图像进行特征编码,将温度、湿度、风速、气压和光照强度等多源气... 针对空气PM_(2.5)浓度检测过度依赖专业设备的问题,提出了一种融合多源信息及图像特征泛化的空气质量检测算法。首先采用EfficientNet-B0作为主干网络对输入的大气可见光图像进行特征编码,将温度、湿度、风速、气压和光照强度等多源气象信息映射为与大气图像对应的特征向量,并与大气图像特征进行拼接融合;然后利用全连接层将全局特征输出为标量,并利用损失函数检测出空气的PM_(2.5)浓度;最后在网络模型训练阶段,通过对大气图像不同尺度的特征进行随机泛化增强来丰富样本分布空间,使网络能够在有限的数据样本中学习到更多特征,从而有效改善了检测网络的性能。实验结果表明:设计的检测方法与几种主流的方法相比具有更高的检测精度和稳定性,在测试集上得到的RMSE和R-squared分别为21.55μg/m^(3)和0.923,通过对8个场景检测,得到结果的平均误差仅为5.2%,最大误差也仅为7.6%,能够适应各类极端大气污染环境的空气质量检测任务。 展开更多
关键词 空气质量 PM_(2.5)检测 卷积神经网络 多源信息 特征泛化增强 特征融合
在线阅读 下载PDF
面向深度学习编译器TVM的算子融合优化
10
作者 高伟 王磊 +2 位作者 李嘉楠 李帅龙 韩林 《计算机科学》 北大核心 2025年第5期58-66,共9页
算子融合是深度学习编译器中的一种编译优化技术,能够将多个算子合并为一个大的算子,有效降低计算和访存的成本。深度学习编译器TVM的算子融合方案中将算子按照功能特性进行分类,并设计融合规则,最后采用贪心算法进行融合。这种融合方... 算子融合是深度学习编译器中的一种编译优化技术,能够将多个算子合并为一个大的算子,有效降低计算和访存的成本。深度学习编译器TVM的算子融合方案中将算子按照功能特性进行分类,并设计融合规则,最后采用贪心算法进行融合。这种融合方案存在以下问题:首先,功能特性的算子分类方式下的融合规则不够通用,会错失算子融合机会,无法实现更大粒度的融合;其次,贪心的融合算法也无法实现算子融合的最优解。针对上述问题,对TVM进行改进,提出按照算子输入输出映射类型的算子分类方式,并设计通用的算子融合规则以扩大算子融合的粒度;提出基于动态规划的融合方案搜索算法和算子融合代价评估模型,并对搜索空间进行剪枝,使得算法能够在合理时间内搜索得到优化的融合方案。为评测融合方案的有效性,在CPU以及DCU等平台上对VGG-16,Efficient-B0,MobileNet-V1,YOLO-V4等深度学习模型的融合比和推理时延进行测试,实验结果表明,相较于TVM原有融合方案,所提方案融合比平均提升了27%,推理时延平均获得了1.75的加速比。 展开更多
关键词 深度学习编译器 TVM 算子融合 融合规则 动态规划
在线阅读 下载PDF
基于人类视觉认知机制的表面缺陷检测 被引量:1
11
作者 崔丽莎 代润鹏 +3 位作者 姜晓恒 李飞蝶 陈恩庆 徐明亮 《浙江大学学报(理学版)》 北大核心 2025年第1期38-49,共12页
进行表面缺陷检测是确保产品性能、质量、美观度以及生产效率的重要手段。尽管人工智能在视觉检测领域取得了飞速发展,但基于生物视觉认知指导机器视觉学习的方法,仍是研究难点。提出了一种基于人类视觉认知机制的表面缺陷检测网络(HVCM... 进行表面缺陷检测是确保产品性能、质量、美观度以及生产效率的重要手段。尽管人工智能在视觉检测领域取得了飞速发展,但基于生物视觉认知指导机器视觉学习的方法,仍是研究难点。提出了一种基于人类视觉认知机制的表面缺陷检测网络(HVCM-Net)。在宏观层面,模拟视网膜上中央凹和中央凹外区域的工作原理,提出了中央视觉分支和外周视觉分支并行的骨干网络,分别负责学习缺陷图像的高空间频率局部细节信息和低空间频率全局语义信息。在微观层面,动态权重融合模块(DWFM)以自适应的方式融合两个分支的输出特征图,可学习和过滤更全面、准确和互补的缺陷特征。另外,融合分支引入特征保存下采样(FPD)模块,采用特征拼接技术,有效缓解了传统采样可能产生的微弱缺陷信息丢失问题。HVCM-Net在缺陷数据集GB-DET、NEU-DET和DAGM2007上取得了优于其他方法的检测性能,验证了其有效性。 展开更多
关键词 缺陷检测 人类视觉 中央视觉 外周视觉 特征融合
在线阅读 下载PDF
动态旋转因子生成的流水线NTT高效硬件实现
12
作者 韩迎梅 李斌 +2 位作者 李坤 周清雷 于世梁 《计算机科学》 北大核心 2025年第9期160-169,共10页
在全同态加密领域,多项式乘法的高复杂度计算一直是性能提升的难点。为加速此过程,数论变换(Number Theoretic Transform,NTT)被广泛应用,但传统基于多路径延迟交换的NTT架构存在硬件利用率不足、旋转因子开销大等缺点。针对这些问题,... 在全同态加密领域,多项式乘法的高复杂度计算一直是性能提升的难点。为加速此过程,数论变换(Number Theoretic Transform,NTT)被广泛应用,但传统基于多路径延迟交换的NTT架构存在硬件利用率不足、旋转因子开销大等缺点。针对这些问题,提出了一种基于流水线架构的NTT硬件加速器设计方案。该方案在多路径延迟交换架构的基础上进行优化,通过统一的NTT/INTT(Inverse NTT)框架,结合流水线技术实现高度并行计算。在设计过程中,优化集成的蝶形单元引入流水线友好的改进K-RED算法,灵活适配多种运算策略,加速大规模数据处理。此外,该设计方案采用动态旋转因子生成技术,旋转因子生成器(Twiddle Factor Generation,TFG)与蝶形单元紧密协作。在初始小参数阶段,从ROM读取预存旋转因子以节省逻辑资源;在参数较大时,启用TFG动态生成旋转因子并直接分配给相应的蝶形单元,实现资源高效平衡,有效降低了旋转因子的存储需求。现场可编程门阵列实现结果表明,与以往的研究相比,所提方案在全同态加密参数集的NTT上的执行速度提高了1.14~40.81倍;同时,在硬件资源占用方面,该方案在面积-时间乘积指标上减少了23%~82%。 展开更多
关键词 全同态加密 多项式乘法 数论变换 流水线 动态旋转因子
在线阅读 下载PDF
融合语义与属性特征的跨架构漏洞检测
13
作者 李坤 李斌 +1 位作者 朱文静 周清雷 《计算机科学与探索》 北大核心 2025年第3期787-801,共15页
二进制漏洞检测在程序安全领域有着重要的作用,为应对大规模的漏洞检测任务,越来越多的神经网络技术被应用到跨架构漏洞检测中,这些技术显著提高了漏洞检测的准确率,但是现有方法仍然面临提取到的信息单一、不能进行跨架构漏洞检测等问... 二进制漏洞检测在程序安全领域有着重要的作用,为应对大规模的漏洞检测任务,越来越多的神经网络技术被应用到跨架构漏洞检测中,这些技术显著提高了漏洞检测的准确率,但是现有方法仍然面临提取到的信息单一、不能进行跨架构漏洞检测等问题。提出了一种融合语义与属性特征的跨架构漏洞检测方法。使用二进制函数的汇编代码和属性控制流图作为输入,提取基本块中所有汇编代码的语义信息,将基本块级的语义信息与属性特征信息进行特征融合,生成139维的基本块级向量表示,以此来更全面地表示函数的语义和属性信息。使用基于卷积神经网络的孪生网络模型生成函数级的嵌入向量,以此来提取不同基本块中不同空间层次结构的特征并减少神经网络的参数量,通过计算函数级嵌入向量的距离来判断待检测的两个二进制函数是否相似。在进行跨架构漏洞检测时,只需要输入二进制文件中的函数和已知漏洞函数的汇编代码和属性控制流图即可完成漏洞检测。实验结果表明,该方法检测的准确率为95.64%,AUC(area under curve)值为0.9969,与现有方法相比,准确率可以提升0.26~7.04个百分点,AUC可以提升0.11~1.59个百分点,在真实环境的漏洞检测中表现优异。 展开更多
关键词 漏洞检测 神经网络 跨架构 特征融合 函数级
在线阅读 下载PDF
纺织品表面缺陷知识图谱构建研究
14
作者 姜晓恒 吕鹏帅 +3 位作者 刘允 卢洋 张坤丽 徐明亮 《计算机工程与应用》 北大核心 2025年第19期292-301,共10页
针对纺织品表面缺陷领域的知识存在主观性强、结构分散的问题,研究了面向纺织品表面缺陷的知识图谱构建方法。对纺织品表面缺陷的实体类型和关系种类进行定义,共划分出7种实体类别和26种关系类别,以此为基础标注并构建了纺织品表面缺陷... 针对纺织品表面缺陷领域的知识存在主观性强、结构分散的问题,研究了面向纺织品表面缺陷的知识图谱构建方法。对纺织品表面缺陷的实体类型和关系种类进行定义,共划分出7种实体类别和26种关系类别,以此为基础标注并构建了纺织品表面缺陷知识图谱数据集。同时,联合基于词典特征增强的实体抽取模型与基于残差注意力增强的双分支关系抽取模型对实体关系进行自动化抽取,构建纺织品表面缺陷知识图谱。实验结果表明,该模型在纺织品表面缺陷领域中的命名实体识别与关系抽取两项任务上的F1值均达到了91%。此外,使用Neo4j数据库对知识图谱进行存储与可视化,并为纺织品表面缺陷知识图谱的下游应用,如智能问答提供了技术支撑。 展开更多
关键词 知识图谱 深度学习 知识抽取 残差注意力增强
在线阅读 下载PDF
面向DCU的流固耦合浸没边界算法异构实现
15
作者 商建东 熊威 +3 位作者 华浩波 宋昭璐 郭恒亮 张军 《计算机工程》 北大核心 2025年第7期263-274,共12页
直接力浸没边界法是求解流固耦合问题的常见方法之一,其可以有效地处理复杂的几何形状,包括移动和变形的固体。然而,三维复杂流动模拟具有网格规模大、耗时多的特点,在单核处理器上使用传统的串行算法往往无法满足计算要求。目前,在国... 直接力浸没边界法是求解流固耦合问题的常见方法之一,其可以有效地处理复杂的几何形状,包括移动和变形的固体。然而,三维复杂流动模拟具有网格规模大、耗时多的特点,在单核处理器上使用传统的串行算法往往无法满足计算要求。目前,在国产平台上对流固耦合问题的研究较少,而在国产平台上实现直接力浸没边界算法能够丰富平台的应用生态。为此,使用国产DCU(Deep Compute Unit)加速器,基于CPU-DCU异构编程,设计并实现利用三维直接力浸没边界算法求解流固耦合问题的并行程序。首先,在CPU上实现串行算法并进行热点分析,对程序热点部分使用DCU加速器进行异构加速;其次,在异构实现的基础上,结合DCU硬件特性,使用共享内存、循环分块、调整访存顺序等优化手段对核函数进行优化;最后,通过圆球绕流和仿生鱼自主游动算例对程序进行正确性验证和性能测试。实验结果表明,在雷诺数分别为100和200时,圆球的阻力系数分别为1.11和0.78,计算结果均与相关文献吻合;在雷诺数为7142的仿生鱼自主游动实验中,游动稳定后的平均前进速度为0.396,该结果与相关文献结果一致。在圆球绕流实验中,在5033万网格规模下该并行程序较串行程序获得了83.7倍的加速效果。通过两类流固耦合数值实验,验证了CPU-DCU并行直接力浸没边界算法在国产异构平台上进行计算的有效性和准确性,这为国产平台上CFD(Computational Fluid Dynamics)算法的研究提供了坚实基础。 展开更多
关键词 异构计算 DCU加速器件 访存优化 直接力浸没边界法 流固耦合
在线阅读 下载PDF
一种基于TVM的自动调度搜索优化方法
16
作者 韩林 王一帆 +1 位作者 李嘉楠 高伟 《计算机科学》 北大核心 2025年第3期268-276,共9页
随着人工智能的迅猛发展,新型算子与硬件不断涌现,算子库的开发和维护面临着巨大的挑战,仅仅依靠手工优化已无法满足AI模型性能提升的需求。Ansor是一种基于TVM的算子自动调度技术,可以针对不同的后端搜索深度学习模型或算子的最佳调度... 随着人工智能的迅猛发展,新型算子与硬件不断涌现,算子库的开发和维护面临着巨大的挑战,仅仅依靠手工优化已无法满足AI模型性能提升的需求。Ansor是一种基于TVM的算子自动调度技术,可以针对不同的后端搜索深度学习模型或算子的最佳调度方案,生成高性能代码而无需用户手动定义模板,但其巨大的搜索空间造成了搜索效率低下的问题。因此,提出了两种优化方案:1)基于强化学习的算法实现最佳性能草图的选择;2)基于机器学习模型的突变规则预测。两种优化方案旨在缩短最佳调度方案的搜索时间,快速生成高性能的算子。为评估优化方案的有效性,对Resnet-50等3种模型和conv2d等3种算子进行测试与评估。结果显示,优化后的Ansor只用70%~75%的搜索时间就可以生成性能与之前相同甚至更优的目标程序,并且在最佳迭代次数下,目标程序的推理速度最高可提升5%。 展开更多
关键词 自动调度 TVM编译器 搜索速度优化 机器学习 强化学习 深度学习模型
在线阅读 下载PDF
基于少样本学习的表面缺陷检测方法综述
17
作者 陈丽 殷湘婷 +3 位作者 靳启帆 姜晓恒 酒明远 徐明亮 《郑州大学学报(理学版)》 北大核心 2025年第3期1-11,共11页
工业场景中,缺陷样本少且标注缺陷耗时耗力,这限制了机器视觉方法应用于表面缺陷检测。首先对基于少样本学习的工业品缺陷检测方法进行梳理,从图像采集、图像处理、缺陷检测三个方面介绍了基于机器视觉的工业品缺陷检测技术。将缺陷检... 工业场景中,缺陷样本少且标注缺陷耗时耗力,这限制了机器视觉方法应用于表面缺陷检测。首先对基于少样本学习的工业品缺陷检测方法进行梳理,从图像采集、图像处理、缺陷检测三个方面介绍了基于机器视觉的工业品缺陷检测技术。将缺陷检测方法分为传统表面缺陷检测方法和基于少样本深度学习的缺陷检测方法。传统表面缺陷检测方法基于人工提取的特征识别缺陷,分为缺陷分割、人工特征提取、缺陷识别三部分。基于少样本深度学习的工业品缺陷检测方法包括数据增强、迁移学习、模型微调、半监督学习、弱监督学习、无监督学习方法等。其次,介绍了常用的缺陷检测数据集和检测结果评价标准。最后,讨论了基于少样本学习的表面缺陷检测存在的问题和未来研究方向。 展开更多
关键词 缺陷检测 少样本学习 机器视觉 深度学习
在线阅读 下载PDF
基于FPGA的优化型复合TCAM设计与应用 被引量:1
18
作者 梅进 于哲 +3 位作者 陈方 王彬 周舜民 赵子龙 《现代电子技术》 北大核心 2025年第14期1-6,共6页
三态内容可寻址存储器(TCAM)是网络架构中的重要组件之一,用于高速搜索应用。目前基于FPGA实现的TCAM多基于单一类型存储资源,消耗的存储资源量较大,且在实际应用中TCAM的搜索字多样化,易造成存储资源冗余。针对此问题,提出一种综合利用... 三态内容可寻址存储器(TCAM)是网络架构中的重要组件之一,用于高速搜索应用。目前基于FPGA实现的TCAM多基于单一类型存储资源,消耗的存储资源量较大,且在实际应用中TCAM的搜索字多样化,易造成存储资源冗余。针对此问题,提出一种综合利用FPGA中Block RAM(BRAM)与查找表RAM(LUTRAM)来优化对搜索字划分的方法。通过灵活组合BRAM和LUTRAM,实现更加接近甚至贴合搜索字位数的优化型复合TCAM(OC-TCAM),从而降低存储资源用量,并将该设计应用于网络数据包的过滤与加密系统中。实验结果表明,所提方法相较于目前领先的基于BRAM的TCAM,存储资源用量减少了39.1%,相比于领先的基于FPGA的复合TCAM,单位面积的性能提升了20.28%。 展开更多
关键词 三态内容可寻址存储器 静态随机存取存储器 现场可编程门阵列 资源存储 网络数据包过滤 加密系统
在线阅读 下载PDF
改性自具微孔聚合物的Au(Ⅲ)吸附性能研究
19
作者 冯孝权 张学毅 +1 位作者 王保营 张亚涛 《水处理技术》 北大核心 2025年第10期263-271,共9页
黄金(Au)作为一种不可再生贵金属资源,广泛应用于电子、珠宝、航空航天及催化等领域。随着现代社会经济快速发展,迭代频繁造成的废弃电器或电子设备即电子垃圾给人类及生存环境带来了恶劣影响,同时造成资源浪费问题。吸附法作为一种低... 黄金(Au)作为一种不可再生贵金属资源,广泛应用于电子、珠宝、航空航天及催化等领域。随着现代社会经济快速发展,迭代频繁造成的废弃电器或电子设备即电子垃圾给人类及生存环境带来了恶劣影响,同时造成资源浪费问题。吸附法作为一种低成本、无污染及高效率的方法,有望从电子废液中高效回收金。本文通过对自具微孔聚合物(PIM-1)进行化学后改性分别合成了PIM-1-COOH(羧酸改性)和TPIM-1(硫代酰胺改性),并使用相转化法制备为聚合物基多孔吸附球。其中,TPIM-1多孔吸附球具有优异吸附性能,可在较宽pH范围(pH=1~10)获得超过95%的去除率。准二级动力学模型和Langmuir等温线模型能很好的描述TPIM-1多孔吸附球对Au(Ⅲ)的吸附过程,在45℃时获得最大实验吸附容量,为1872.8 mg/g。在12种共存离子的存在下,仍能取得高达99.6%的去除率。吸附机理研究表明硫代酰胺官能团中-NH_(2)和S的双还原作用是TPIM-1多孔吸附球具有优异吸附性能的关键。 展开更多
关键词 自具微孔聚合物 后改性 Au(Ⅲ)吸附 选择性吸附 吸附机理
在线阅读 下载PDF
基于粒子群算法的自动向量化收益评估模型研究
20
作者 刘梦真 周清雷 +4 位作者 韩林 聂凯 李浩然 陈梦尧 刘浩浩 《计算机科学》 北大核心 2025年第7期248-254,共7页
自动向量化技术利用SIMD部件加速程序的执行,减轻了程序员的负担,是GCC编译器中的重要优化过程之一。但GCC编译器中自动向量化的收益评估模型并不准确,会影响GCC编译器是否应该进行向量化转换的判定。为了提升申威平台上的自动向量化效... 自动向量化技术利用SIMD部件加速程序的执行,减轻了程序员的负担,是GCC编译器中的重要优化过程之一。但GCC编译器中自动向量化的收益评估模型并不准确,会影响GCC编译器是否应该进行向量化转换的判定。为了提升申威平台上的自动向量化效率,基于申威平台上的GCC编译器,构建了一套新的自动向量化收益评估模型。针对申威处理器的后端指令集设计不同种类的代价,通过粒子群算法训练相对应的代价值,以提高申威平台上自动向量化收益评估模型的准确性。在SPEC2006和SPEC2017上进行了实验测试,与GCC编译器默认的收益评估模型相比,所提模型在SPEC2006课题上加速比最高提升7.6%,在SPEC2017课题上加速比最高提升5.75%,验证了模型的有效性。实验结果表明,所提出的模型可进一步完善基础自动向量化功能,提升申威平台编译系统的易用性。 展开更多
关键词 申威平台 GCC编译器 自动向量化 收益评估模型 粒子群算法
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部