期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
面向“嵩山”平台供水管网仿真计算的移植优化研究
1
作者 郭恒亮 李冰洋 +3 位作者 杨周凡 韩璞 胥博文 商建东 《计算机应用与软件》 北大核心 2025年第4期44-50,共7页
供水管网仿真系统拓扑结构复杂,元件数据密集,系统的高效仿真对实施平台的性能提出了很高的要求。“嵩山”超级计算机系统采用CPU+DCU异构架构,为实现仿真计算在该架构上的高效运行。根据HIP异构编程模型将计算热点映射至DCU加速器上实... 供水管网仿真系统拓扑结构复杂,元件数据密集,系统的高效仿真对实施平台的性能提出了很高的要求。“嵩山”超级计算机系统采用CPU+DCU异构架构,为实现仿真计算在该架构上的高效运行。根据HIP异构编程模型将计算热点映射至DCU加速器上实现,使用MULTPARA多级并行优化方法实现不同元件计算在DCU加速器上的并发,解决线程块间不能充分并行的问题,利用跨线程访问方法解决部分元件计算中存在的线程束分化问题。实验结果表明,相较过往实施平台取得了8.537的加速比。 展开更多
关键词 异构并行 管网仿真计算 DCU加速器 MULTPARA方法 跨线程访问
在线阅读 下载PDF
黄河中下游河南省高质量发展与生态环境耦合协调度时空格局研究 被引量:20
2
作者 魏杰 刘丽娜 +3 位作者 马云霞 申进朝 王强 王振峰 《河南师范大学学报(自然科学版)》 CAS 北大核心 2022年第2期48-57,共10页
科学认知经济高质量发展与生态环境保护之间的耦合协调关系,对于指导我国未来可持续发展具有重要的现实意义.以地处黄河中下游的河南省为研究区域,构建经济高质量发展和生态环境评价指标体系,运用耦合协调度模型分析了两者之间的协调发... 科学认知经济高质量发展与生态环境保护之间的耦合协调关系,对于指导我国未来可持续发展具有重要的现实意义.以地处黄河中下游的河南省为研究区域,构建经济高质量发展和生态环境评价指标体系,运用耦合协调度模型分析了两者之间的协调发展情况,结果表明:(1)河南省各市生态环境指数值域范围为0.143~0.808,北部和中部地区相对较低,南部和西南部相对较高,地域分异特征明显;(2)通过分析2014至2018年河南省各市高质量发展指数,发现郑州市历年均在0.8以上,远高于其他城市;(3)2014至2018年河南省各市耦合协调度值介于0.34~0.73,主要处于勉强耦合协调和中级耦合协调阶段,南北地区差异明显.针对河南省经济发展和生态环境保护现状,可通过构建中原城市群“一核一副四轴四区”的空间格局,引领其他城市经济快速发展,同时,通过建设黄河中下游生态走廊,加强黄河中下游生态环境同治共保. 展开更多
关键词 黄河中下游 高质量发展 生态环境 耦合协调度 河南省
在线阅读 下载PDF
面向FT-M7002的阈值分割算法优化实现
3
作者 陈云 胡伟方 +1 位作者 王梦园 商建东 《计算机应用与软件》 北大核心 2024年第8期254-258,310,共6页
在国产高性能DSP的快速发展过程中,缺乏能充分发挥其体系结构优势的高性能图像处理算法。针对以上问题,对应用比较广泛的Otsu阈值分割算法进行面向FT平台的并行优化。在分析FT-M7002体系结构以及Otsu阈值分割算法的基础上,使用飞腾向量... 在国产高性能DSP的快速发展过程中,缺乏能充分发挥其体系结构优势的高性能图像处理算法。针对以上问题,对应用比较广泛的Otsu阈值分割算法进行面向FT平台的并行优化。在分析FT-M7002体系结构以及Otsu阈值分割算法的基础上,使用飞腾向量指令集进行手工向量化改写以充分利用FT-M7002平台超长向量寄存器,从而减少数据访存次数提高数据级并行性。在多种图像矩阵规模下进行性能测试,结果显示,阈值分割中的阈值比较模块优化后获得了3.74~4.39倍的加速效果,Otsu阈值分割算法总体优化实现获得了1.77~1.87倍的加速效果。 展开更多
关键词 FT-M7002 Otsu阈值分割 手工向量化 循环展开 数据级并行
在线阅读 下载PDF
Canny边缘检测算法在飞腾平台上的实现与优化 被引量:7
4
作者 郭恒亮 柴晓楠 +2 位作者 韩林 赫晓慧 商建东 《计算机工程》 CAS CSCD 北大核心 2021年第7期37-43,共7页
为实现国产飞腾DSP平台对底层图像库的支持,针对原始Canny边缘检测算法计算时间过长的问题,设计一种面向FT-M7002平台的Canny梯度计算并行算法。基于FT-M7002高性能处理架构,采用单指令流多数据流向量化方式增强DSP内核指令的并行处理能... 为实现国产飞腾DSP平台对底层图像库的支持,针对原始Canny边缘检测算法计算时间过长的问题,设计一种面向FT-M7002平台的Canny梯度计算并行算法。基于FT-M7002高性能处理架构,采用单指令流多数据流向量化方式增强DSP内核指令的并行处理能力,根据FT-M7002平台向量存储器的层次结构特征,分析Canny梯度计算并行算法的访存模式,通过首地址偏移取址解决不连续访存问题,并结合双缓冲方式完成数据传输与数据计算。实验结果表明,在与原始Canny算法具有相同检测精度的情况下,该算法在卷积核大小为3×3、5×5、7×7时整体运行速度提升了1.490~2.112倍,缩小了与主流加速器件在数字图像处理领域的性能差距。 展开更多
关键词 FT-M7002处理器 CANNY边缘检测 梯度计算并行 访存优化 双缓冲方式
在线阅读 下载PDF
基于核岭回归算法的PROSAIL模型反演高空间分辨率叶面积指数 被引量:7
5
作者 郭恒亮 李晓 +1 位作者 付羽 乔宝晋 《草业学报》 CSCD 北大核心 2022年第12期41-51,共11页
准确估算叶面积指数(LAI)在生态、环境和气候变化研究方面具有重要作用。依靠卫星遥感技术能够获取大范围LAI产品,但其空间分辨率较低且依赖大量地面实测数据,难以满足高精度、大范围研究的需求。本研究基于30 m空间分辨率地表反射率数... 准确估算叶面积指数(LAI)在生态、环境和气候变化研究方面具有重要作用。依靠卫星遥感技术能够获取大范围LAI产品,但其空间分辨率较低且依赖大量地面实测数据,难以满足高精度、大范围研究的需求。本研究基于30 m空间分辨率地表反射率数据,在不依赖大量地面实测数据的情况下,提出基于核岭回归算法的PROSAIL物理模型反演LAI,首先对PROSAIL模型的输入参数进行敏感性分析,以确定输入参数并生成模拟数据集,从而建立模拟反射率与LAI之间的核岭回归反演模型,进行高空间分辨率LAI反演,并与基于多层感知机的PROSAIL模型、基于随机森林回归的PROSAIL模型进行对比分析。结果表明:基于核岭回归的PROSAIL模型获得了最高的LAI反演精度,模型决定系数(R2)为0。8089,均方根误差(RMSE)为0。2492,基于多层感知机和随机森林回归的PROSAIL模型反演精度较差,模型R2分别为0。7726和0。7118,RMSE分别为0。2781和0。2432。研究认为基于核岭回归的PROSAIL模型可以有效提升LAI反演精度,为快速准确的区域性高空间分辨率LAI反演提供了技术和方法。 展开更多
关键词 叶面积指数 核岭回归算法 PROSAIL模型 反演
在线阅读 下载PDF
基于多尺度特征融合的遥感影像语义分割 被引量:3
6
作者 郭恒亮 牛子儒 +1 位作者 赫晓慧 田智慧 《计算机应用与软件》 北大核心 2023年第11期248-253,共6页
针对传统的遥感影像语义分割方法存在分类能力差和分割效果不精细的问题,设计并实现一种基于U-Net的多尺度特征融合网络。网络通过多尺度跳跃连接组合不同层级的语义特征;结合通道注意力机制增强跳跃连接中关键特征的表达能力;利用空洞... 针对传统的遥感影像语义分割方法存在分类能力差和分割效果不精细的问题,设计并实现一种基于U-Net的多尺度特征融合网络。网络通过多尺度跳跃连接组合不同层级的语义特征;结合通道注意力机制增强跳跃连接中关键特征的表达能力;利用空洞空间金字塔池化结构融合深层特征,进一步加强网络在复杂背景中的分类性能。在公开数据集Vaihingen上进行的实验表明,多尺度特征融合网络相比通用分割网络具有更高的表现性能和更好的实用价值。 展开更多
关键词 遥感影像 语义分割 多尺度跳跃连接 空洞空间金字塔池化 注意力机制
在线阅读 下载PDF
面向YHFT-M7002平台图像中值滤波算法的优化实现 被引量:3
7
作者 王梦园 柴晓楠 +1 位作者 陈云 商建东 《计算机应用与软件》 北大核心 2023年第9期205-210,241,共7页
随着FT系列处理器在图像处理领域的广泛应用,目前缺少可以充分发挥FT平台优势的高性能图形图像处理库。针对上述问题,在完成FT-M7002平台中OpenCV2.4.9图像库移植的基础上,提出面向该平台的中值滤波算法优化实现。通过分析FT-M7002的体... 随着FT系列处理器在图像处理领域的广泛应用,目前缺少可以充分发挥FT平台优势的高性能图形图像处理库。针对上述问题,在完成FT-M7002平台中OpenCV2.4.9图像库移植的基础上,提出面向该平台的中值滤波算法优化实现。通过分析FT-M7002的体系结构特点与中值滤波算法特性,使用手工向量化、循环展开、双缓冲等手段进行程序优化,充分利用该平台向量运算单元以及向量寄存器资源,提升该算法的数据级与指令级并行性。测试结果表明,相对于中值滤波算法的串行实现,其优化实现能在保证正确性的基础上获得5~16倍的加速效果。 展开更多
关键词 中值滤波 高性能处理器 向量化
在线阅读 下载PDF
内容一致性行人重识别算法 被引量:3
8
作者 田智慧 郑付科 高需 《计算机工程》 CAS CSCD 北大核心 2021年第3期237-242,共6页
行人重识别是指利用计算机视觉技术识别不同监控设备下的目标行人,该技术在公共安全与相册管理等方面应用较广。然而现有行人重识别算法在局部特征区域划分后出现离异值使该区域内容不一致,导致局部特征可区分性降低。提出一种基于局部... 行人重识别是指利用计算机视觉技术识别不同监控设备下的目标行人,该技术在公共安全与相册管理等方面应用较广。然而现有行人重识别算法在局部特征区域划分后出现离异值使该区域内容不一致,导致局部特征可区分性降低。提出一种基于局部区域特征选择的内容一致性行人重识别算法。将行人图像输入残差卷积神经网络取得张量,根据局部区域内容一致性从张量中选择基本单位特征向量,使用Softmax函数计算其局部区域概率重新生成局部区域,从而消除离异值,增加类间差异并减少类内差异。实验结果表明,与Spindel、PN-GAN等行人重识别算法相比,该算法的行人重识别准确率更高,其提取的行人特征可区分性和鲁棒性更好。 展开更多
关键词 行人重识别 公共安全 内容一致性 局部特征 离异值
在线阅读 下载PDF
基于优化神经网络的AOD与PM_(2.5)关系模型研究 被引量:3
9
作者 郭恒亮 葛岂序 +1 位作者 代文浩 乔宝晋 《环境科学与技术》 CAS CSCD 北大核心 2021年第12期46-53,共8页
为了克服BP神经网络反演PM_(2.5)精度较低的问题,基于2017-2019年河南省MODIS气溶胶光学厚度(AOD)与PM_(2.5)浓度数据,使用量化共轭梯度算法代替传统BP神经网络使用的LM(Levenberg-Marquardt)算法,收敛速度快,且不需要其他参数。为了验... 为了克服BP神经网络反演PM_(2.5)精度较低的问题,基于2017-2019年河南省MODIS气溶胶光学厚度(AOD)与PM_(2.5)浓度数据,使用量化共轭梯度算法代替传统BP神经网络使用的LM(Levenberg-Marquardt)算法,收敛速度快,且不需要其他参数。为了验证优化算法,将研究数据按照季节分类,使用日均PM_(2.5)近地面值与AOD构建关系模型。对于MODIS AOD在时空上的缺失,使用暗像元算法反演MODIS遥感图像作为补充。其中70%数据建立训练集,20%的数据建立验证集,10%的数据建立测试集。实验结果表明:PM_(2.5)与AOD存在正相关性,其中春季相关性0.7,夏季0.84,秋季0.68,冬季0.56。优化的模型相比BP神经网络模型,R值四季均有提高,春季0.54提升到0.62,夏季0.82提升到0.86,秋季0.72提升到0.79,冬季0.53提升到0.64;RMSE四季均有降低。从结果可以看出,PM_(2.5)与AOD存在显著的相关性,可以用AOD来反演PM_(2.5)。优化的神经网络模型在精度上有明显提高,可以用于估算高精度的PM_(2.5)浓度。 展开更多
关键词 气溶胶光学厚度 暗像元 量化共轭梯度 神经网络模型
在线阅读 下载PDF
面向FT-M7002的高斯滤波算法优化实现 被引量:7
10
作者 陈云 王梦园 +1 位作者 柴晓楠 商建东 《计算机工程与科学》 CSCD 北大核心 2021年第5期799-806,共8页
国产自主研发的飞腾系列高性能DSP处理器在图像处理领域的应用,对面向该平台的高性能图像处理算法提出了强烈需求。高斯滤波作为图像处理的基础算法,能有效滤除图像中的高斯噪声,在图像处理领域具有广泛应用。针对飞腾高性能DSP的体系... 国产自主研发的飞腾系列高性能DSP处理器在图像处理领域的应用,对面向该平台的高性能图像处理算法提出了强烈需求。高斯滤波作为图像处理的基础算法,能有效滤除图像中的高斯噪声,在图像处理领域具有广泛应用。针对飞腾高性能DSP的体系结构特点与高斯滤波算法特性,实现了面向飞腾高性能DSP的高斯滤波算法优化。通过手工向量化、控制流消除和循环展开等优化手段充分利用数据级与指令级并行性,从而减少数据访存次数,提高指令执行效率。针对FT-MT2内核中的DMA硬件及向量存储器结构特点,进行了“乒-乓”缓存、DMA数组转置等优化,以减少数据传输时间,提高数据局部性。多种滤波核大小及图像矩阵规模下的测试结果表明,相对于高斯滤波算法的串行实现,该并行优化实现获得了1.3~1.41倍的加速比。在开启Cache的情况下,相较于dsplib库中高斯滤波算法在TMS320C6678平台上的运行性能,获得了1.15~1.71倍的加速效果。 展开更多
关键词 高性能DSP 高斯滤波 向量并行优化 DMA传输优化
在线阅读 下载PDF
基于ResNet的彩色眼底图片分类算法研究 被引量:3
11
作者 陈亚浩 张东 《计算机应用与软件》 北大核心 2023年第8期250-254,320,共6页
为了提高现有算法对眼底彩照的识别准确度,提出一种基于深度残差网络(ResNet)的眼底图像分类方法,对获取到的眼底图像进行基于DSP-Fs流程的数据预处理操作,使用Laplacian滤波处理以突出异常眼底图像的特征,有效地提高神经网络学习的质量... 为了提高现有算法对眼底彩照的识别准确度,提出一种基于深度残差网络(ResNet)的眼底图像分类方法,对获取到的眼底图像进行基于DSP-Fs流程的数据预处理操作,使用Laplacian滤波处理以突出异常眼底图像的特征,有效地提高神经网络学习的质量;用残差网络代替传统的卷积神经网络,提取更深层次的特征,同时修改网络结构以提升模型效率达到病变分类的目的。在ODIR数据集上对不同的预处理方式和网络结构进行了对比实验,结果表明,该算法能够有效地提升眼底彩色图像分类的准确度。 展开更多
关键词 眼底图像 图像分类 残差网络 Laplacian滤波
在线阅读 下载PDF
基于改进U-Net神经网络的图像去噪算法 被引量:8
12
作者 姜旭 赵荣彩 +1 位作者 刘勇杰 宋雯琦 《科学技术与工程》 北大核心 2022年第9期3629-3635,共7页
针对目前常见的U-Net网络结构以及现有的图像去噪算法在去除图像噪声时,处理后得到的图像较为模糊且图像的边缘纹理过于光滑缺乏真实性的问题,提出了一种改进的U-Net网络结构去噪算法。它由去噪模块以及边缘信息提取模块组成,首先,利用U... 针对目前常见的U-Net网络结构以及现有的图像去噪算法在去除图像噪声时,处理后得到的图像较为模糊且图像的边缘纹理过于光滑缺乏真实性的问题,提出了一种改进的U-Net网络结构去噪算法。它由去噪模块以及边缘信息提取模块组成,首先,利用U-Net++中的跳跃连接应用到原始的U型去噪子网中,密集连接的U型去噪网络可以减少编码器与解码器特征映射之间的语义差距,还原出更清晰的图像。其次,基于VGG-16网络结构的边缘信息提取模块对去噪网络处理后的图像进行特征提取,同时反向优化U型去噪模块,还原出更真实的图像。实验表明,在常见的Set5、Set12、Kodak24和CBSD68数据集测试所提出的算法,在图像的客观评价指标上均优于目前具有代表性的去噪算法,同时图像的边缘细节和纹理特征更清晰真实,视觉效果上更好。 展开更多
关键词 图像去噪 U-Net神经网络 多特征融合 跳跃连接 计算机视觉
在线阅读 下载PDF
多尺度特征提取的道路场景语义分割 被引量:1
13
作者 商建东 刘艳青 高需 《计算机应用与软件》 北大核心 2021年第11期174-178,共5页
道路场景语义分割是自动驾驶系统的重要组成部分。道路场景中环境复杂、物体种类繁多且尺寸差异较大,已有的全卷积神经网络(FCN)特征提取能力不足,导致语义分割精度较低。对此,提出一种多尺度特征提取网络(Multi-scale Feature Extracti... 道路场景语义分割是自动驾驶系统的重要组成部分。道路场景中环境复杂、物体种类繁多且尺寸差异较大,已有的全卷积神经网络(FCN)特征提取能力不足,导致语义分割精度较低。对此,提出一种多尺度特征提取网络(Multi-scale Feature Extraction Network, MFNet),该网络采用并行的特征提取模块提取不同尺度下的不变特征,增强特征多样性,通过逐层的反卷积操作,将特征上采样恢复至原始图像大小,设计分级训练方法并优化loss函数。在多个公开数据集上对该算法进行评估,取得了良好的分割效果。 展开更多
关键词 语义分割 自动驾驶 神经网络 特征提取 反卷积
在线阅读 下载PDF
基于数据重用分析的多面体循环合并策略
14
作者 胡伟方 陈云 +1 位作者 李颖颖 商建东 《计算机科学》 CSCD 北大核心 2021年第12期49-58,共10页
现有多面体编译工具往往使用一些简单的启发式策略来寻找最优的语句合并,对于不同的待优化程序,需要手工调整循环合并策略以获得最佳性能。针对这一问题,面向多核CPU目标平台,文中提出了一种基于数据重用分析的循环合并策略。该策略避... 现有多面体编译工具往往使用一些简单的启发式策略来寻找最优的语句合并,对于不同的待优化程序,需要手工调整循环合并策略以获得最佳性能。针对这一问题,面向多核CPU目标平台,文中提出了一种基于数据重用分析的循环合并策略。该策略避免了不必要的且会影响数据局部性利用的合并限制:针对调度的不同阶段,提出了面向不同并行层次的并行性合并限制;对于数组访问关系较为复杂的语句,提出了面向CPU高速缓存优化的分块性合并限制。相较于以往的合并策略,该策略在计算合并收益时考虑到了空间局部性的变化。文中基于LLVM编译框架中的多面体编译模块Polly实现了这一策略,并选用Polybench等测试套件中的部分测试用例进行测试。实验结果表明,相较于现有的多种合并策略,在单核执行情况下,测试用例平均获得了14.9%~62.5%的性能提升;在多核执行情况下,多个测试用例平均获得了19.7%~94.9%的性能提升,在单个测试用例中最高获得了1.49x~3.07x的加速效果。 展开更多
关键词 编译优化 多面体模型 LLVM编译框架 循环合并 数据局部性
在线阅读 下载PDF
基于申威众核处理器的Office口令恢复向量化研究
15
作者 李辉 韩林 +1 位作者 陶红伟 董本松 《计算机科学》 CSCD 北大核心 2022年第S02期745-749,共5页
为了满足农业农村大数据应用中数据安全的需求,文章结合Office口令恢复中的计算热点问题,以申威众核处理器为硬件平台,提供了一种向量化密码解算方法。SHA-1和AES函数的解析是方法的核心部分。首先,利用申威众核处理器的特点,对其进行... 为了满足农业农村大数据应用中数据安全的需求,文章结合Office口令恢复中的计算热点问题,以申威众核处理器为硬件平台,提供了一种向量化密码解算方法。SHA-1和AES函数的解析是方法的核心部分。首先,利用申威众核处理器的特点,对其进行自动向量化研究;其次,通过依赖性分析描述了明文块之间手动向量化过程,给出方法理论层面的可行性结论;最后,为验证方法的正确性和有效性,将Office各个版本的加密文档作为用例,开展多重数据测试,测试结果与传统的口令恢复工具和开源的Hashcat口令恢复工具进行对比。实验结果表明,方法能够有效地提高口令恢复的性能。 展开更多
关键词 大数据 数据解密 SHA-1 AES 向量化
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部