期刊文献+
共找到172篇文章
< 1 2 9 >
每页显示 20 50 100
Grover量子搜索算法在“嵩山”超级计算机系统中的模拟
1
作者 杜帅岐 刘晓楠 +1 位作者 廉德萌 刘正煜 《计算机科学》 CSCD 北大核心 2024年第9期96-102,共7页
量子计算凭借其叠加性和纠缠性,具有强大的并行计算能力。然而,目前的量子计算机不能在保证大规模量子比特处于稳定叠加态的同时,进行干涉、纠缠等量子操作。因此,当前研究和推动量子计算的有效途径是使用经典计算机模拟量子计算。Grove... 量子计算凭借其叠加性和纠缠性,具有强大的并行计算能力。然而,目前的量子计算机不能在保证大规模量子比特处于稳定叠加态的同时,进行干涉、纠缠等量子操作。因此,当前研究和推动量子计算的有效途径是使用经典计算机模拟量子计算。Grover量子搜索算法针对无序数据库搜索问题设计,将搜索的时间复杂度加速至开平方级,能加速机器学习中的主成分分析。因此,研究和模拟Grover算法,可以促进量子计算与机器学习结合领域的发展,为Grover量子搜索算法的应用以及量子机器学习在“嵩山”超级计算机系统中的模拟奠定基础。通过研究Grover量子搜索算法,模拟出了算法的量子线路。使用Toffoli量子门优化该量子线路,在减少了两个辅助量子比特的同时,提出了Grover算法的通用量子线路。实验基于“嵩山”超级计算机系统的CPU+DCU异构体系,使用了MPI多进程+HIP多线程的两级并行策略。通过调整辅助比特在量子线路中的位置,减少了MPI进程间的通信;使用分片的方式传输数据依赖的量子态。对比串行版本,并行化的模拟算法取得了最高560.33倍的加速,首次实现了31qubits规模的Grover量子搜索算法。 展开更多
关键词 GROVER量子搜索算法 异构体系 MPI HIP 分片传输
在线阅读 下载PDF
暗态势计算:概念、方法与应用
2
作者 李超超 程兰惠 +4 位作者 杨赛赛 吕培 葛昭阳 王华 徐明亮 《计算机辅助设计与图形学学报》 北大核心 2025年第4期568-582,共15页
态势感知指对环境元素的感知、理解和预测,为高层决策提供支撑.态势信息的全面获取能够有效地提高态势感知的准确性.针对态势信息不直观、态势获取不全面的问题,提出“暗态势计算”概念,辅助人类挖掘、感知全面态势信息.首先,介绍暗态... 态势感知指对环境元素的感知、理解和预测,为高层决策提供支撑.态势信息的全面获取能够有效地提高态势感知的准确性.针对态势信息不直观、态势获取不全面的问题,提出“暗态势计算”概念,辅助人类挖掘、感知全面态势信息.首先,介绍暗态势计算的内涵和优势,并给出理论支撑;然后,充分地利用增强现实技术,以生动直观的呈现方式、沉浸式智能交互、虚实叠加等诸多优势,设计基于增强现实的人机物虚实融合暗态势计算框架,基于增强现实技术将机器的计算能力和人的认知能力结合,通过“虚实融合观察—沉浸式交互—全面分析预测”循环迭代过程实现暗态势计算;最后,以基于航母航空保障作业的半实物电子沙盘推演系统为例,阐述暗态势计算的应用.实验结果表明,所提方法的决策结果优于基于传统态势感知的决策结果,验证了该方法的合理性及优势. 展开更多
关键词 暗态势 态势感知 增强现实 态势预测 人机协同
在线阅读 下载PDF
复杂场景下的多人人体姿态估计算法
3
作者 石磊 王天宝 +3 位作者 孟彩霞 王清贤 高宇飞 卫琳 《郑州大学学报(理学版)》 北大核心 2025年第4期1-7,共7页
复杂场景下人员的交叉遮挡,导致现有的人体姿态估计算法存在准确度不高和人体骨架错连的问题。为此,提出一种复杂场景下的多人人体姿态估计优化算法。首先,使用分组分块级联卷积替换普通卷积,结合特征融合促进特征通道之间的信息交互,... 复杂场景下人员的交叉遮挡,导致现有的人体姿态估计算法存在准确度不高和人体骨架错连的问题。为此,提出一种复杂场景下的多人人体姿态估计优化算法。首先,使用分组分块级联卷积替换普通卷积,结合特征融合促进特征通道之间的信息交互,在不引入额外计算成本的前提下提高算法精度;其次,引入空间注意力机制挖掘与人体姿态估计任务相关的空间语义特征,将网络结构并行化处理以提高算法性能;最后,对大卷积核和空间注意力机制的嵌入位置进行轻量化处理,减少时间开销。与现有的自底向上的姿态估计算法OpenPifPaf++相比,所提算法在COCO 2017数据集上平均准确率提高0.8个百分点;在CrowdPose数据集上平均准确率比OpenPifPaf算法提高1.2个百分点,复杂场景下对应的准确率提高1.5个百分点。 展开更多
关键词 复杂场景 多人人体姿态估计 分组卷积 空间注意力机制 轻量化
在线阅读 下载PDF
基于“嵩山”超级计算机系统下HHL算法的模拟实现 被引量:2
4
作者 谢浩山 刘晓楠 +1 位作者 赵晨言 刘正煜 《计算机科学》 CSCD 北大核心 2023年第6期74-80,共7页
量子计算是一种遵循量子力学规律来调控量子信息单元进行计算的新型计算模式,而量子算法由一系列量子门组合而成,其实现形式为量子线路。量子线路是对量子比特进行操作的线路,以量子比特为基本的存储单元,将量子逻辑门连接在一起来实现... 量子计算是一种遵循量子力学规律来调控量子信息单元进行计算的新型计算模式,而量子算法由一系列量子门组合而成,其实现形式为量子线路。量子线路是对量子比特进行操作的线路,以量子比特为基本的存储单元,将量子逻辑门连接在一起来实现特定的计算功能。文中在“嵩山”超级计算机上利用MPI+OpenMP混合并行编程模型,实现了将大规模量子线路拆分到不同节点上进行构建,加快了线路的构建速度,并且在CPU集群系统上具有良好的可拓展性。针对节点间通信问题,设计了序列化和反序列化函数,以保证节点间数据的传输,并且根据各节点所分配任务量间存在的指数级差异,设计了一种拆分任务量、各节点轮循处理的优化方式,实现了节点间的负载均衡。最后在超级计算机CPU集群上成功实现了大规模的量子相位估计线路的构造,相较于单节点取得了8.63的加速比,并通过HHL算法验证了所设计的并行相位估计子模块的正确性,为大规模HHL算法在超算平台上的实现提供了参考。 展开更多
关键词 量子相位估计 CPU集群 MPI HHL算法 负载均衡
在线阅读 下载PDF
基于“嵩山”超级计算机的UCX库分析与优化
5
作者 刘康 万伟 +2 位作者 刘波 李俊宏 李柱 《计算机工程》 CAS CSCD 北大核心 2023年第12期274-281,共8页
UCX是一个经过生产验证的优化通信框架,适用于当前的高带宽和低延迟高速网络。UCX作为“嵩山”国产高性能计算平台的通信中间件,提高了并行编程模型在InfiniBand(IB)高速互联网络上的开发效率,同时其性能也会直接影响上层应用的通信能... UCX是一个经过生产验证的优化通信框架,适用于当前的高带宽和低延迟高速网络。UCX作为“嵩山”国产高性能计算平台的通信中间件,提高了并行编程模型在InfiniBand(IB)高速互联网络上的开发效率,同时其性能也会直接影响上层应用的通信能力。基于“嵩山”超级计算平台,对平台上的UCX框架进行分析与性能测试,在此过程中归纳IB适配器通信存在的局限性以及UCX在通信传输选择中的不合理性。针对这些问题,根据“嵩山”超级计算平台的网络架构特点,在参数层面进行调优,使得UCX适配“嵩山”平台的Socket Direct架构;在代码层面修改UCX对传输的选择逻辑,使得UCX在选出共享内存传输后不再选择网卡进行传输,从而解决节点内的进程间通信抢占HCA卡资源的问题。同时,修正UCX中KNEM共享内存的带宽设置,使UCX在共享内存CMA和KNEM传输的选择上更加合理。实验结果表明,使用优化后的UCX在100个节点间进行allgather集合通信测试时,相对优化前延迟至多降低80%,节点内alltoall集合通信延迟至多降低70%,gather集合通信延迟至多降低45%。改进后的UCX通信库为“嵩山”超级计算平台上的并行编程模型和应用提供了更好的互联网络支撑,明显提升了平台的集合通信性能。 展开更多
关键词 UCX框架 高性能计算 集合通信 InfiniBand协议 共享内存 消息传递接口 高速网络
在线阅读 下载PDF
云计算环境下的拟态IAM系统设计实现方法 被引量:4
6
作者 宋玉 孙贺 +2 位作者 王家兴 潘云飞 张建辉 《计算机工程与设计》 北大核心 2024年第5期1297-1304,共8页
随着云计算的快速发展及其普及,企业的传统数据安全边界被打破,出现云资产管理混乱、越权、误操作等现象,对用户的信息安全产生巨大威胁。基于此,对目前云计算环境下身份认证和访问管理(identity and access management,IAM)的安全问题... 随着云计算的快速发展及其普及,企业的传统数据安全边界被打破,出现云资产管理混乱、越权、误操作等现象,对用户的信息安全产生巨大威胁。基于此,对目前云计算环境下身份认证和访问管理(identity and access management,IAM)的安全问题进行研究,提出结合内生安全思想,采取拟态防御手段构建出一种具有内生安全效应的拟态身份认证和访问管理(mimicry identity and access management,MIAM)体系架构方案,并对其进行详细描述。将该方案分别进行稳定性测试、系统性能测试以及系统安全性评估,实验数据表明,该方案具有可行性和安全性。 展开更多
关键词 云计算 拟态防御 内生安全 身份认证 访问管理 信息安全 网络安全
在线阅读 下载PDF
面向国产超算平台的通用能源管网仿真计算模型 被引量:1
7
作者 韩璞 商建东 +3 位作者 薛飞 谢景明 王洪生 王海 《计算机应用研究》 CSCD 北大核心 2024年第3期866-872,共7页
为实现城市能源管网仿真软件的自主可控,基于国产异构高性能计算机“嵩山”超级计算平台,提出一种通用的城市能源管网仿真计算模型。通过优化管网中“非管”组件模型,提高了计算模型对国产异构并行计算机系统的适配性;将不同管网组件的... 为实现城市能源管网仿真软件的自主可控,基于国产异构高性能计算机“嵩山”超级计算平台,提出一种通用的城市能源管网仿真计算模型。通过优化管网中“非管”组件模型,提高了计算模型对国产异构并行计算机系统的适配性;将不同管网组件的计算过程进行封装,弱化了网络组件在仿真计算过程的依赖性,提升模型在工程实现上的可并行性。供水、燃气和热力三种场景的并行仿真实验,证明了计算模型在解决城市能源供给网络的仿真计算上具有一定的普适性;通过管网实测数据与仿真模型中模拟数据对比结果表明仿真管网压力的误差率在4%以下,其温度的误差率低于2%,同时也说明了提出的管网仿真计算模型在国产超算平台上具有良好的计算通用性。 展开更多
关键词 异构计算 能源管网 仿真模型 流体网络 并行计算
在线阅读 下载PDF
精确制导武器智能化若干问题思考 被引量:1
8
作者 樊会涛 张新朝 《航空兵器》 CSCD 北大核心 2024年第2期1-7,共7页
本文介绍了人工智能技术对精确制导武器智能化的推动作用,概述了精确制导武器探测识别和制导控制智能化现状,探讨了精确制导武器智能化过程中面临的大规模样本构建、仿真性能向真实能力迁移、不可解释性和可靠性质疑、智能武器性能评估... 本文介绍了人工智能技术对精确制导武器智能化的推动作用,概述了精确制导武器探测识别和制导控制智能化现状,探讨了精确制导武器智能化过程中面临的大规模样本构建、仿真性能向真实能力迁移、不可解释性和可靠性质疑、智能武器性能评估等问题,并针对性的给出了半实物仿真训练、迁移学习、模仿人类直觉与理性结合、重构评估方法等解决思路。提出了精确制导武器智能化对装备研制和作战使用的三个影响:模拟仿真技术重要性凸显、训练模式将发生重大变革、现有作战模式将被颠覆。 展开更多
关键词 精确制导武器 人工智能 迁移学习 直觉与理性结合
在线阅读 下载PDF
SDENet:基于多尺度注意力质量感知的合成缺陷数据评价网络 被引量:2
9
作者 卢洋 陈林慧 +1 位作者 姜晓恒 徐明亮 《图学学报》 北大核心 2025年第1期94-103,共10页
通过对数据扩增方式合成的缺陷数据进行质量评估,有助于实现缺陷数据高质量扩充,进而缓解缺陷数据不足导致的检测模型性能不佳问题。针对现有质量评价算法在评估合成缺陷数据质量时更关注数据的失真特性而忽略了对数据缺陷属性考量的问... 通过对数据扩增方式合成的缺陷数据进行质量评估,有助于实现缺陷数据高质量扩充,进而缓解缺陷数据不足导致的检测模型性能不佳问题。针对现有质量评价算法在评估合成缺陷数据质量时更关注数据的失真特性而忽略了对数据缺陷属性考量的问题,提出一种基于注意力特征增强(AFE)和多尺度注意力质量感知(MAQP)的模型SDENet,综合考虑数据的失真特性和缺陷属性进行质量评价。首先,AFE通过双分支池化操作提高模型对不同尺寸、位置缺陷的泛化能力,并结合注意力机制增强模型对特征的表达。其次,MAQP对AFE增强后的特征进行向量化与融合处理,以更好地感知合成缺陷数据质量。最后,对融合后的特征进行质量评估,得到最终的评估分数。在构建的合成道路裂缝缺陷数据集上进行实验,结果表明,SDENet模型在RMSE,RMAE,PLCC和SROCC指标上均取得最优结果,比次优模型依次提升10.7%,5.0%,1.8%和1.8%,验证了模型的有效性。在失真数据集TID2013上,SDENet模型也取得较有竞争的结果,在PLCC和SROCC指标上依次达到0.902和0.876。 展开更多
关键词 注意力机制 特征增强 特征融合 合成缺陷数据 质量评价
在线阅读 下载PDF
基于多粒度声呐图像匹配的水下定位方法
10
作者 王可 王振鹤 +4 位作者 王彪 刘攀第 王华 李佳欣 徐明亮 《舰船科学技术》 北大核心 2025年第14期95-102,共8页
针对水下地形匹配定位问题,提出一种基于多粒度声呐图像匹配的定位方法。构建了U-Net架构的图像特征抽取模型,以无监督方式抽取水下声呐图像的高层特征。设计了一种具有时空约束的多粒度匹配算法,在特征空间内首先进行粗粒度匹配,并结... 针对水下地形匹配定位问题,提出一种基于多粒度声呐图像匹配的定位方法。构建了U-Net架构的图像特征抽取模型,以无监督方式抽取水下声呐图像的高层特征。设计了一种具有时空约束的多粒度匹配算法,在特征空间内首先进行粗粒度匹配,并结合时空约束约简搜索空间,然后进行细粒度精确匹配,根据匹配结果实现水下定位。通过建模水下典型地形并进行模拟声呐探测构建了数据集,包括水下地形高程数据和对应的声呐探测图像。在自构数据集上的实验结果表明,所提方法的定位精度可达0.679 m,平均单次定位时长小于0.5 s,性能优于基线算法。 展开更多
关键词 水下定位 声呐图像 特征匹配 图像检索 多粒度
在线阅读 下载PDF
基于自适应特征增强和融合的舰载机着舰拉制状态识别
11
作者 王可 刘奕阳 +3 位作者 杨杰 鲁爱国 李哲 徐明亮 《上海交通大学学报》 北大核心 2025年第2期274-282,共9页
拉制状态识别能辅助着舰信号官及时准确地形成后续指挥决策,是舰载机着舰引导的重要环节.提出一种基于自适应特征增强和融合的拉制状态识别方法,包含基于注意力机制的特征增强模块,通过分割特征图、串联空间域和通道域增强视觉表征能力... 拉制状态识别能辅助着舰信号官及时准确地形成后续指挥决策,是舰载机着舰引导的重要环节.提出一种基于自适应特征增强和融合的拉制状态识别方法,包含基于注意力机制的特征增强模块,通过分割特征图、串联空间域和通道域增强视觉表征能力;利用多尺度特征融合模块,将高分辨率浅层特征与语义信息丰富的深层特征进行融合,充分利用上下文语义信息.基于所提方法,设计基于可穿戴增强现实设备的着舰拉制状态识别原型系统;构建着舰作业虚实融合数据集以评估方法性能.结果表明,所提算法综合性能优于基线算法,能满足拉制状态识别的应用需求. 展开更多
关键词 舰载机 阻拦着舰 特征融合 注意力机制 状态识别
在线阅读 下载PDF
自监督流形结构的第一视角视频时序分割算法
12
作者 张明明 闫小强 +2 位作者 孙中川 胡世哲 叶阳东 《计算机学报》 北大核心 2025年第2期266-283,共18页
随着可穿戴设备和智能存储技术的普及,第一视角视频的使用量高速增长。将这类视频划分成独立的视频片段以提取关键的内容信息,成为了视频理解领域的重要研究方向。这类视频数据规模大、维度高、内容多样,基于欧氏空间的特征学习方法难... 随着可穿戴设备和智能存储技术的普及,第一视角视频的使用量高速增长。将这类视频划分成独立的视频片段以提取关键的内容信息,成为了视频理解领域的重要研究方向。这类视频数据规模大、维度高、内容多样,基于欧氏空间的特征学习方法难以有效地处理复杂高维的视频数据。现有时序分割算法在处理第一视角长视频时,很难应对因手部遮挡和运动模糊而导致的帧信息丢失问题。针对上述问题,本文提出了一种自监督流形结构的第一视角视频时序分割算法(Self-Supervised Manifold Structure,SSMS)。受高维视频数据在低维流形空间中具有相似语义聚集现象的启发,该算法将包含时序信息的帧特征进行低维嵌入,使得语义相似的帧特征映射到流形空间中相近位置。首先,本文提出了一种改进的局部流形结构特征学习策略,提取帧数据的局部流形结构。其次,SSMS算法构建了动态时序网络,基于最大相似关系来获得具有不变性的特征表示。然后,将帧数据的流形结构特征作为监督信号进行自监督学习。经过不断迭代优化,得到低维高质量的帧数据特征。最后,通过聚类过程实现第一视角视频的无监督时序分割,避免了标注数据的限制和成本。相比于现有的无监督时序分割算法,本文方法在五个第一视角数据集上平均提高了3.37%的准确度。 展开更多
关键词 第一视角视频 流形结构 自监督学习 时序分割 特征表示
在线阅读 下载PDF
基于容错高斯消元的线性分组码校验矩阵重建
13
作者 王忠勇 张洪 +3 位作者 巩克现 王玮 张玲 朱俊昊 《通信学报》 北大核心 2025年第4期224-237,共14页
针对线性分组码校验矩阵重建容错性能差的问题,提出了一种基于容错高斯消元的校验矩阵重建算法。首先,通过多次随机抽取码字的部分比特构建残缺码字,依据比特对数似然比绝对值的均值和最小值计算其可靠度,从而筛选出高可靠度的残缺码组... 针对线性分组码校验矩阵重建容错性能差的问题,提出了一种基于容错高斯消元的校验矩阵重建算法。首先,通过多次随机抽取码字的部分比特构建残缺码字,依据比特对数似然比绝对值的均值和最小值计算其可靠度,从而筛选出高可靠度的残缺码组。其次,针对残缺码组基的部分错误状态,利用容错高斯消元算法求解与之对应的疑似校验向量,进而从中判定并还原出真实的校验向量。最后,依据码字比特能否通过已知校验向量更新比特对数似然比绝对值,进一步提升比特可靠度,为下次随机抽取部分比特带来增益。仿真结果表明,在相同识别条件下,所提算法的重建率高于现有算法。对于IEEE802.11n协议下的LDPC(648,324)码,现有算法在误码率达到0.0055时即失效,而所提算法在误码率为0.008时,校验矩阵重建率仍能达到98%以上。 展开更多
关键词 线性分组码 校验矩阵重建 码字筛选 高斯消元
在线阅读 下载PDF
基于区块链的去中心化多授权机构访问控制方法
14
作者 刘炜 李淑培 +1 位作者 田钊 佘维 《郑州大学学报(理学版)》 北大核心 2025年第5期46-53,共8页
传统的基于单一授权机构的访问控制方案存在单点故障、效率低下等问题,为此提出一种基于区块链的去中心化多授权机构访问控制方法。首先,采用基于联盟链的多授权机构取代传统访问控制方法中的中心化实体,提供可靠、细粒度的访问控制;其... 传统的基于单一授权机构的访问控制方案存在单点故障、效率低下等问题,为此提出一种基于区块链的去中心化多授权机构访问控制方法。首先,采用基于联盟链的多授权机构取代传统访问控制方法中的中心化实体,提供可靠、细粒度的访问控制;其次,智能合约允许自动化访问判决,为了解决多授权机构带来的访问效率问题,提出一种基于智能合约的数据映射算法,利用数据关键信息构建映射表实现数据快速访问;最后,实验表明,所提出的方案能够有效降低用户访问时延,实现数据访问过程中的安全共享。 展开更多
关键词 访问控制 区块链 智能合约 属性加密 数据共享
在线阅读 下载PDF
利用盲签名+洋葱路由的匿名服务器访问方案
15
作者 李猛 李晓宇 《计算机工程与设计》 北大核心 2025年第6期1664-1669,共6页
为保护注册用户的身份和IP地址隐私,提出一种结合盲签名和洋葱路由的匿名访问方案。用户通过盲签名技术从服务器获取假名ID,并用此假名ID访问服务器,确保服务器能验证ID合法性但无法识别用户真实身份。用户通过假名ID访问服务器时使用... 为保护注册用户的身份和IP地址隐私,提出一种结合盲签名和洋葱路由的匿名访问方案。用户通过盲签名技术从服务器获取假名ID,并用此假名ID访问服务器,确保服务器能验证ID合法性但无法识别用户真实身份。用户通过假名ID访问服务器时使用洋葱路由技术,使请求经过多个中转节点后到达服务器,确保服务器和中转节点均无法获取用户的IP地址。方案整合盲签名技术和洋葱路由技术,使合法的注册用户在访问服务器时其真实身份和IP地址均保持匿名,有效保护用户的隐私。 展开更多
关键词 网络安全 混合加密 洋葱路由 匿名通信 健壮性 盲签名 匿名访问
在线阅读 下载PDF
基于少数类加权和异常连通性的不平衡节点分类
16
作者 王军锋 杨佳悦 李钝 《郑州大学学报(工学版)》 北大核心 2025年第3期136-142,152,共8页
基于GNN的机器人检测方法在处理类不平衡问题时,忽略了少数类节点的重要性,同时未考虑图结构特有的链接性问题,使得节点分类效果不理想。针对现有方案的不足,提出了一种基于少数类加权和异常连通性裕度损失的类不平衡节点分类算法,将传... 基于GNN的机器人检测方法在处理类不平衡问题时,忽略了少数类节点的重要性,同时未考虑图结构特有的链接性问题,使得节点分类效果不理想。针对现有方案的不足,提出了一种基于少数类加权和异常连通性裕度损失的类不平衡节点分类算法,将传统机器学习领域的不平衡分类思想扩展到图结构数据,在GraphSMOTE的基础上进行少数类加权聚合处理,以增强少数节点的特征聚合;在过采样阶段,利用SMOTE算法对不平衡数据进行处理,并考虑了节点表示和拓扑结构。同时,训练一个边缘生成器来建模关系信息,并引入异常连通性裕度损失,以提高GNN对链接异常性的感知,增强模型对连通性信息的学习。最后在公开的微博、Twitter虚假账户和BlogCatalog数据集上进行实验,与SMOTE、Re-weight、GraphSMOTE、DR-GCN和mGNN这5种方法的对比结果表明:所提算法平均ACC达到84.3%;在Kaggle数据集上,所提算法比mGNN模型准确度提升1.3%。 展开更多
关键词 机器人账户 类不平衡 图结构 少数类加权 连通性
在线阅读 下载PDF
基于混合深度卷积的遥感影像语义分割
17
作者 田智慧 郎杰 魏海涛 《计算机应用与软件》 北大核心 2025年第8期253-258,290,共7页
高分辨率遥感影像语义分割作为遥感解译的重要组成部分,其中包含了大量复杂的地物特征信息,且不同地物目标尺寸相差较大,这为遥感影像语义分割带来了一定困难。针对该问题,设计并实现一种基于混合深度卷积的遥感影像语义分割模型MDU-Ne... 高分辨率遥感影像语义分割作为遥感解译的重要组成部分,其中包含了大量复杂的地物特征信息,且不同地物目标尺寸相差较大,这为遥感影像语义分割带来了一定困难。针对该问题,设计并实现一种基于混合深度卷积的遥感影像语义分割模型MDU-Net。该模型在编码器中采用分阶段的并行网络结构,通过对不同层级中子分支动态的分配权重来实现编码器的动态网络结构,同时引入一种通道和空间注意力模块来改进编码器到解码器的特征融合效果,提升语义分割效果。在ISPRS validation数据集上的测试集精度比DeepLabv3+提高3.44百分点。实验结果表明,该网络在高分辨率遥感影像分割问题中取得了良好的分割效果。 展开更多
关键词 语义分割 遥感影像 深度学习 特征融合
在线阅读 下载PDF
面向深度学习编译器TVM的算子融合优化
18
作者 高伟 王磊 +2 位作者 李嘉楠 李帅龙 韩林 《计算机科学》 北大核心 2025年第5期58-66,共9页
算子融合是深度学习编译器中的一种编译优化技术,能够将多个算子合并为一个大的算子,有效降低计算和访存的成本。深度学习编译器TVM的算子融合方案中将算子按照功能特性进行分类,并设计融合规则,最后采用贪心算法进行融合。这种融合方... 算子融合是深度学习编译器中的一种编译优化技术,能够将多个算子合并为一个大的算子,有效降低计算和访存的成本。深度学习编译器TVM的算子融合方案中将算子按照功能特性进行分类,并设计融合规则,最后采用贪心算法进行融合。这种融合方案存在以下问题:首先,功能特性的算子分类方式下的融合规则不够通用,会错失算子融合机会,无法实现更大粒度的融合;其次,贪心的融合算法也无法实现算子融合的最优解。针对上述问题,对TVM进行改进,提出按照算子输入输出映射类型的算子分类方式,并设计通用的算子融合规则以扩大算子融合的粒度;提出基于动态规划的融合方案搜索算法和算子融合代价评估模型,并对搜索空间进行剪枝,使得算法能够在合理时间内搜索得到优化的融合方案。为评测融合方案的有效性,在CPU以及DCU等平台上对VGG-16,Efficient-B0,MobileNet-V1,YOLO-V4等深度学习模型的融合比和推理时延进行测试,实验结果表明,相较于TVM原有融合方案,所提方案融合比平均提升了27%,推理时延平均获得了1.75的加速比。 展开更多
关键词 深度学习编译器 TVM 算子融合 融合规则 动态规划
在线阅读 下载PDF
基于动态融合注意力机制的电力负荷缺失数据填充模型
19
作者 赵冬 李亚瑞 +1 位作者 王文相 宋伟 《郑州大学学报(工学版)》 北大核心 2025年第2期111-118,共8页
为了提高电力负荷数据的缺失值填充精度,保障后续数据分析与应用的高效进行,首先,提出一种基于动态融合注意力机制的填充模型(DFAIM),该模型由注意力机制模块和动态加权融合模块构成,通过注意力机制模块的两种不同注意力机制挖掘特征与... 为了提高电力负荷数据的缺失值填充精度,保障后续数据分析与应用的高效进行,首先,提出一种基于动态融合注意力机制的填充模型(DFAIM),该模型由注意力机制模块和动态加权融合模块构成,通过注意力机制模块的两种不同注意力机制挖掘特征与时间戳之间的深层关联;其次,通过动态加权融合模块将可学习的权重赋予注意力机制模块的两个输出以得到特征表示;最后,利用特征表示来替换缺失位置的值,从而得到准确的填充结果。使用纽约市某地区的气象及负荷数据集及UCI电力负荷数据集对提出的模型进行验证,实验结果表明:相较于统计学、机器学习和深度学习填充模型,DFAIM在评价指标MAE、RMSE和MRE上均具有一定优势。 展开更多
关键词 缺失值填充 注意力机制 电力负荷 时序特征
在线阅读 下载PDF
面向国产加速器的并行代码自动生成框架
20
作者 王玲 高娅 +1 位作者 吉青 卜景德 《计算机工程与设计》 北大核心 2025年第5期1438-1444,共7页
国产加速器复杂的硬件架构需要编写高度优化的代码才能充分发挥其卓越性能,由此带来繁重工作量和技术难度,为此提出一种面向国产加速器的并行代码自动生成框架。基础配置参数模块涵盖广泛的参数选项,实现代码自动调优,提高框架的通用性... 国产加速器复杂的硬件架构需要编写高度优化的代码才能充分发挥其卓越性能,由此带来繁重工作量和技术难度,为此提出一种面向国产加速器的并行代码自动生成框架。基础配置参数模块涵盖广泛的参数选项,实现代码自动调优,提高框架的通用性;预定义代码生成模块生成汇编代码并加入算法优化,扩展预定义代码的汇编指令适配目标架构支持的指令集使该框架适用于其它加速器;最优代码选择模块根据框架生成的多组代码执行情况智能地选择性能最佳的代码进行输出。实验结果表明,该框架能够生成常见数据类型的程序,使用优化组件组合后生成的基准测试程序的性能可达到国产加速器理论峰值的90.1%。 展开更多
关键词 国产加速器 自动调优 配置参数 预定义代码 汇编指令 最优代码选择 代码自动生成
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部