期刊文献+
共找到8,043篇文章
< 1 2 250 >
每页显示 20 50 100
面向SW26010-Pro众核处理器的新型矩阵存储格式及稀疏矩阵向量乘(SpMV)算法研究
1
作者 王萃 刘芳芳 +2 位作者 马文静 赵玉文 胡力娟 《计算机学报》 北大核心 2025年第6期1290-1304,共15页
稀疏矩阵向量乘(Sparse Matrix-Vector Multiplication,SpMV)是高性能计算、人工智能大模型领域中的关键操作,其性能通常对应用程序整体性能的提升具有重要影响。高效的稀疏矩阵存储格式是影响SpMV性能的重要因素,然而,现有的稀疏矩阵... 稀疏矩阵向量乘(Sparse Matrix-Vector Multiplication,SpMV)是高性能计算、人工智能大模型领域中的关键操作,其性能通常对应用程序整体性能的提升具有重要影响。高效的稀疏矩阵存储格式是影响SpMV性能的重要因素,然而,现有的稀疏矩阵存储格式主要通过压缩零元素以减少访存,未充分利用非零元素的数值规律,因此仍有进一步压缩和优化的空间。本文通过对压缩稀疏行(Compressed Sparse Row,CSR)存储格式中非零元数组内的重复元素进行进一步的压缩,提出了一种新型的稀疏矩阵存储格式(Further Compressed Sparse Row,FCSR),并设计了从CSR到FCSR格式转换的异构并行算法,以尽量减少格式转换带来的开销。同时,本文面向SW26010-Pro众核处理器,设计了基于FCSR存储格式的SpMV异构并行算法,对SpMV进行了细粒度的任务划分和并行优化设计,探究了五种向量x的间接访存方式,并通过双缓冲技术对算法进行了优化。最后,本文选用SuiteSparse矩阵集中的稀疏矩阵进行了测试,实验结果表明,本文提出的基于FCSR存储格式的异构众核SpMV算法相较于主核版SpMV算法具有明显的性能提升,最高加速比达到43.11,平均加速比为7.56,测试矩阵最高带宽利用率达到了91.13%,平均带宽利用率为26.27%。另外,本文对基于FCSR存储格式和CSR存储格式的SpMV算法性能进行了比较,在两者均得到充分优化的前提下,基于FCSR存储格式的SpMV算法相较于基于CSR存储格式的SpMV算法性能的平均加速比达到1.19。 展开更多
关键词 稀疏矩阵向量 SW26010-Pro众核处理器 新型矩阵存储格式 并行优化 双缓冲技术
在线阅读 下载PDF
输入感知的通用矩阵-向量乘算法在Hygon DCU的自适应性能优化
2
作者 李庆 贾海鹏 +1 位作者 张云泉 张思佳 《计算机科学》 北大核心 2025年第4期291-300,共10页
GEMV(通用矩阵-向量乘法函数)是BLAS(基础线性代数子程序)算法库的核心组成部分,广泛用于计算机科学、工程计算和数学计算等领域。当前,随着国产Hygon DCU版本的不断迭代升级,Hygon DCU与传统GPU生产商之间也存在一定的竞争优势;随着GEM... GEMV(通用矩阵-向量乘法函数)是BLAS(基础线性代数子程序)算法库的核心组成部分,广泛用于计算机科学、工程计算和数学计算等领域。当前,随着国产Hygon DCU版本的不断迭代升级,Hygon DCU与传统GPU生产商之间也存在一定的竞争优势;随着GEMV应用领域的不断扩大,GEMV的输入特征体现出多样化的趋势。在这种背景下,单纯靠一种优化方法,无法实现GEMV算法在GPU计算平台上所有输入情况下的高性能。因此,在访存优化、指令重排、并行规约、共享内存、线程排布等传统优化手段的基础上,提出了一种输入感知的性能自适应优化方法,其能够根据输入矩阵的不同规模和形状自动调整计算kernel的实现方式以达到最佳性能,显著提高了GEMV在Hygon DCU上的性能。实验结果表明,在Hygon DCU Z100SM上,输入感知的通用矩阵-向量乘算法的整体性能明显优于RocBLAS库中的相关算法,对于不同的矩阵输入规模,性能最大提升为RocBLAS库中对应算法的3.0203倍。 展开更多
关键词 通用矩阵-向量乘法 DCU 基础线性代数子程序函数库 自适应调优 性能优化
在线阅读 下载PDF
基于目标扰动的本地化差分隐私矩阵分解推荐算法 被引量:2
3
作者 王永 罗陈红 +1 位作者 邓江洲 高明星 《计算机学报》 北大核心 2025年第2期451-462,共12页
推荐系统作为有效应对信息过载的工具被广泛应用在电子商务、社交媒体和新闻资讯等领域中。矩阵分解具有泛化能力强和计算效率高的优点,是构建推荐系统的主流算法之一。为提高推荐质量,推荐服务器需要收集大量用户数据用于推荐模型的训... 推荐系统作为有效应对信息过载的工具被广泛应用在电子商务、社交媒体和新闻资讯等领域中。矩阵分解具有泛化能力强和计算效率高的优点,是构建推荐系统的主流算法之一。为提高推荐质量,推荐服务器需要收集大量用户数据用于推荐模型的训练。由于推荐服务器不是完全可信的,向服务器共享用户数据会对用户隐私构成极大的威胁。如何构建一个在保护用户隐私的同时,还能确保推荐质量和准确性的系统,成为了一个热门的研究话题。本地化差分隐私是一种分布式的隐私保护机制,它从中心化差分隐私中发展而来,旨在解决服务器不可信场景下的数据的安全收集和分析。这种框架通过精确的数学证明来确保隐私保护的强度。目前,已经有研究工作将本地化差分隐私引入推荐系统,目的是在推荐效果可接受的情况下,确保用户隐私数据的安全。然而,这些研究还面临一些挑战。首先,隐私保护的范围有限。目前的方法大多只关注显式数据的具体数值,认为这是用户的隐私信息。事实上,攻击者可以通过检查数据是否包含在数据集中,来推测用户的隐私信息。其次,推荐质量较低。本地化差分隐私通过引入扰动来保护用户隐私,但这种方法会导致扰动幅度过大和误差累积,进而影响推荐质量。在推荐服务器不可信场景下,本文提出一种基于本地化差分隐私的矩阵分解推荐算法。首先,该算法将评分数值和评分存在性同时作为隐私保护的对象,为用户提供全面的隐私保护。其次,本算法采用目标扰动方法,添加的噪声量不会随着迭代次数增加而增加,有效避免模型训练过程中噪声累积的问题,保证模型训练的有效性。最后,针对分布式场景下多轮迭代导致的中间参数泄露问题,以无放回方式将采样的模型梯度元素发送给推荐服务器,用于模型训练。本文从理论上证明了所提算法满足本地化差分隐私。对所提算法的效用分析证明本文算法在保证有效的推荐质量的同时,能够实现对用户隐私数据的保护。实验结果表明本文算法极大地提高了隐私保护推荐算法的性能,本文算法在公开数据集上的误差下降幅度平均可达18%,在推荐领域数据隐私保护中展现出良好的应用价值。 展开更多
关键词 矩阵分解 本地化差分隐私 目标扰动 推荐算法 隐私保护
在线阅读 下载PDF
基于监督学习的稀疏矩阵乘算法优选
4
作者 彭林 张鹏 +2 位作者 陈俊峰 唐滔 黄春 《计算机工程与科学》 北大核心 2025年第3期381-391,共11页
稀疏矩阵乘算法中主流的row-by-row计算公式上的SPA、HASH、ESC 3种稀疏矩阵乘实现算法,在对不同的稀疏矩阵进行计算时性能差异显著,在不同非零元规模上单一算法不总是能取得最佳性能,而且单一算法与最优选择存在明显差距。为此,提出了... 稀疏矩阵乘算法中主流的row-by-row计算公式上的SPA、HASH、ESC 3种稀疏矩阵乘实现算法,在对不同的稀疏矩阵进行计算时性能差异显著,在不同非零元规模上单一算法不总是能取得最佳性能,而且单一算法与最优选择存在明显差距。为此,提出了一种基于机器学习的最优稀疏矩阵乘算法选择模型,以给定矩阵集作为数据源,抽取稀疏矩阵的特征,并使用SPA、HASH、ESC计算获得的性能数据进行训练和验证,获得的模型能够仅使用稀疏矩阵的特征即可完成对新数据集的算法优选。实验结果表明,该模型可以获得91%以上的预测准确率,平均性能达到最优选择的98%,是单一算法性能的1.55倍以上,并且可在实际库函数中使用,具有良好的泛化能力和实用价值。 展开更多
关键词 稀疏矩阵 SpGEMM SPA算法 HASH算法 ESC算法 机器学习
在线阅读 下载PDF
基于改进人工蜂鸟算法优化支持向量机的人脸识别算法
5
作者 肖剑 黄博 +2 位作者 程鸿亮 胡欣 袁晔 《计算机工程》 北大核心 2025年第10期319-326,共8页
传统的人脸识别系统在最终人脸分类问题上,通常借助各种仿生学算法与支持向量机(SVM)相结合组成相应的人脸识别模型。该方法通过算法的迭代选取最优SVM参数,然而这种策略在人脸识别方法上存在分类精度较低、训练时间较长且容易陷入局部... 传统的人脸识别系统在最终人脸分类问题上,通常借助各种仿生学算法与支持向量机(SVM)相结合组成相应的人脸识别模型。该方法通过算法的迭代选取最优SVM参数,然而这种策略在人脸识别方法上存在分类精度较低、训练时间较长且容易陷入局部最优解的问题。针对上述问题,提出利用改进人工蜂鸟算法(AHA)优化SVM的人脸识别算法。首先通过引入Tent映射的混沌序列改进人工蜂鸟算法,使蜂鸟种群初始化更为均匀,避免算法陷入局部最优解;其次在SVM进行人脸识别的方法中引入改进AHA,通过设定一定的迭代次数,选择用来优化SVM的最优相关参数,达到提高人脸识别准确率的目的。实验结果表明,将改进的人工蜂鸟算法与灰狼优化(GWO)算法、麻雀搜索算法(SSA)、鲸鱼优化算法(WOA)进行对比,改进AHA在基准函数的求解上具有更快的收敛速度,同时在ORL人脸数据库进行人脸识别实验,将改进AHA与SVM相结合,相比于将GWO、SSA和WOA与SVM相结合,在人脸识别的准确率指标方面,改进AHA结合SVM方案具有更高的准确率和召回率,并且模型推理速度更快。 展开更多
关键词 人工蜂鸟算法 支持向量 人脸识别 TENT映射 混沌序列
在线阅读 下载PDF
基于缓存数据重用的稀疏矩阵向量乘序列优化
6
作者 徐传福 邱昊中 车永刚 《计算机研究与发展》 北大核心 2025年第6期1434-1442,共9页
稀疏线性方程组求解等高性能计算应用常常涉及稀疏矩阵向量乘(SpMV)序列Ax,A2x,…,Asx的计算.上述SpMV序列操作又称为稀疏矩阵幂函数(matrix power kernel,MPK).由于MPK执行多次SpMV且稀疏矩阵保持不变,在缓存(cache)中重用稀疏矩阵,可... 稀疏线性方程组求解等高性能计算应用常常涉及稀疏矩阵向量乘(SpMV)序列Ax,A2x,…,Asx的计算.上述SpMV序列操作又称为稀疏矩阵幂函数(matrix power kernel,MPK).由于MPK执行多次SpMV且稀疏矩阵保持不变,在缓存(cache)中重用稀疏矩阵,可避免每次执行SpMV均从主存加载A,从而缓解SpMV访存受限问题,提升MPK性能.但缓存数据重用会导致相邻SpMV操作之间的数据依赖,现有MPK优化多针对单次SpMV调用,或在实现数据重用时引入过多额外开销.提出了缓存感知的MPK(cache-awareMPK,Ca-MPK),基于稀疏矩阵的依赖图,设计了体系结构感知的递归划分方法,将依赖图划分为适合缓存大小的子图/子矩阵,通过构建分割子图解耦数据依赖,根据特定顺序在子矩阵上调度执行SpMV,实现缓存数据重用.测试结果表明,Ca-MPK相对于Intel OneMKL库和最新MPK实现,平均性能提升分别多达约1.57倍和1.40倍. 展开更多
关键词 稀疏矩阵向量 矩阵幂函数 缓存数据重用 数据依赖 稀疏线性方程组求解
在线阅读 下载PDF
基于改进金豺算法优化最小二乘法支持向量机的磨削表面粗糙度预测
7
作者 朱文博 张淑权 +1 位作者 张梦梦 迟玉伦 《表面技术》 北大核心 2025年第16期165-181,共17页
目的磨削过程中粗糙度直接影响产品质量,为有效预测工件磨削表面粗糙度,基于声发射和振动信号提出一种改进金豺算法(IGJO)优化最小二乘法支持向量(LSSVM)的磨削表面粗糙度预测方法。方法为增强信号特征与磨削表面粗糙度相关性,利用皮尔... 目的磨削过程中粗糙度直接影响产品质量,为有效预测工件磨削表面粗糙度,基于声发射和振动信号提出一种改进金豺算法(IGJO)优化最小二乘法支持向量(LSSVM)的磨削表面粗糙度预测方法。方法为增强信号特征与磨削表面粗糙度相关性,利用皮尔逊相关分析和主成分分析(PCA)对信号特征进行筛选,降低特征之间的多重共线性,降低模型复杂度;为改善磨削表面粗糙度预测模型的性能,对于金豺算法(GJO)易陷入局部最优问题,在GJO基础上引入佳点集初始化种群、非线性能量因子更新策略以及融合鲸鱼优化算法改进搜索策略,提升算法的初始种群多样性、收敛精度和全局搜索能力;为提高磨削表面粗糙度预测模型有效性,利用IGJO对LSSVM进行参数寻优,建立磨削表面粗糙度预测模型。结果通过轴承套圈内滚道磨削加工实验数据进行验证,结果表明IGJO-LSSVM磨削表面粗糙度预测模型能有效预测粗糙度值,预测精度为95.223%,RMSE值为0.0133,MAPE值为4.776%,R2值为0.956,均优于GJO-LSSVM、LSSVM和BP神经网络模型。结论通过IGJO优化后的LSSVM模型可实现磨削表面粗糙度有效预测,同时能够避免传统LSSVM容易陷入局部极小值的问题,对提高产品磨削质量具有重要意义。 展开更多
关键词 磨削表面粗糙度 轴承套圈 最小二乘法支持向量 金豺算法
在线阅读 下载PDF
基于矩阵画像和Louvain社区发现算法的关键核心技术识别研究
8
作者 万校基 赖静 +2 位作者 牟莹禧 朱志国 张丽萍 《情报学报》 北大核心 2025年第7期903-914,共12页
针对现有关键核心技术识别方法较少考虑时间因素和较难解读识别结果等问题,本文提出一种基于矩阵画像(matrix profile,MP)和Louvain社区发现算法的关键核心技术识别方法。该方法基于IPC(international patent classification)小类权重... 针对现有关键核心技术识别方法较少考虑时间因素和较难解读识别结果等问题,本文提出一种基于矩阵画像(matrix profile,MP)和Louvain社区发现算法的关键核心技术识别方法。该方法基于IPC(international patent classification)小类权重和词频分析法识别目标领域热点技术主题,结合高频IPC小类时间序列和MP算法构建技术关联网络,借助Louvain算法和社会网络分析法识别目标领域初始关键核心技术主题。基于特征筛选关键核心技术主题,并通过对技术关联子网络、原始专利数据、相关政策文件和期刊文献的深层次解读来识别目标领域关键核心技术。通过对incoPat专利数据库中2014—2023年物流领域的授权专利进行数据处理和挖掘发现,本文方法能有效识别物流领域关键核心技术,不仅有助于推动行业技术突破和创新,亦可提升国家在全球产业链和价值链中的地位。 展开更多
关键词 关键核心技术 矩阵画像 社区发现算法 技术关联网络 结构洞
在线阅读 下载PDF
方向余弦矩阵的特征值与特征向量及其性质研究
9
作者 张建书 陈菲菲 《南京理工大学学报》 北大核心 2025年第1期25-31,共7页
用来描述两右手笛卡尔直角坐标系相对方位的方向余弦矩阵是计算力学、计算图形学、导航与控制、机器人等领域中最基本的运算量之一。现有文献已经阐明:2个方位不同的坐标系之间的方向余弦矩阵有3个模为1的特征值,其中一个是实数1,其余2... 用来描述两右手笛卡尔直角坐标系相对方位的方向余弦矩阵是计算力学、计算图形学、导航与控制、机器人等领域中最基本的运算量之一。现有文献已经阐明:2个方位不同的坐标系之间的方向余弦矩阵有3个模为1的特征值,其中一个是实数1,其余2个为一对共轭复数;实特征值1表明两坐标系的相对方位可以通过一次简单转动来描述,与实特征值1对应的特征向量与该简单转动的转轴共线;复特征值指数的模等于该简单转动的转角。该文给出了上述实特征值1对应的特征向量性质的几何证明,并重点研究了方向余弦矩阵复特征值对应的复特征向量的性质,通过证明得出:复特征向量的虚部与实部相互垂直且模相等,虚部与实部的叉积与简单转动的转轴共线且同向。最后通过数值算例对方向余弦矩阵的特征值与特征向量的上述性质进行了验证。 展开更多
关键词 方向余弦矩阵 特征值 特征向量 复数特征向量 简单转动
在线阅读 下载PDF
微细导线电容矩阵边界元算法的关键技术研究
10
作者 胡玉生 牛梦园 +1 位作者 何俪瑾 区耀权 《电波科学学报》 北大核心 2025年第3期526-535,共10页
研究了复杂微细导线电容矩阵提取边界元法(boundary element method,BEM)的边界离散问题以及增强计算精度和数值稳定性的有效措施,分析了开阔边界尺寸、开阔边界离散、导线离散对计算精度的影响以及伪解、矩阵奇异性问题,提出了基于导... 研究了复杂微细导线电容矩阵提取边界元法(boundary element method,BEM)的边界离散问题以及增强计算精度和数值稳定性的有效措施,分析了开阔边界尺寸、开阔边界离散、导线离散对计算精度的影响以及伪解、矩阵奇异性问题,提出了基于导线离散迭代和开阔边界迭代两阶段自动迭代边界元算法(automatic iterative boundary element method,AIBEM),并结合实例阐述了全域法和区域分解法两种多层介质问题系数矩阵生成方法。研究结果表明,边界环内生成的系数矩阵存在误差均衡协调问题,对复杂模型需合理选择各线段离散单元数及开阔边界尺寸,通过AIBEM可以获得经济的离散参数,有效避免矩阵奇异性,并提高收敛稳定性。将计算结果与有限元法、解析法、传输线法、矩量法进行了对比分析,证实了算法的可靠性。 展开更多
关键词 微细导线 电容矩阵 边界元法(BEM) 开阔边界 边界离散 多层介质 迭代算法
在线阅读 下载PDF
NM-SpMM:面向国产异构向量处理器的半结构化稀疏矩阵乘算法
11
作者 姜晶菲 何源宏 +2 位作者 许金伟 许诗瑶 钱希福 《计算机工程与科学》 CSCD 北大核心 2024年第7期1141-1150,共10页
深度神经网络在自然语言处理、计算机视觉等领域取得了优异的成果,由于智能应用处理数据规模的增长和大模型的快速发展,对深度神经网络的推理性能要求越来越高,N∶M半结构化稀疏化技术成为平衡算力需求和应用效果的热点技术之一。国产... 深度神经网络在自然语言处理、计算机视觉等领域取得了优异的成果,由于智能应用处理数据规模的增长和大模型的快速发展,对深度神经网络的推理性能要求越来越高,N∶M半结构化稀疏化技术成为平衡算力需求和应用效果的热点技术之一。国产异构向量处理器FT-M7032为智能模型处理中的数据并行和指令并行开发提供了较大空间。针对N∶M半结构化稀疏模型计算稀疏模式多样性,提出了一种面向FT-M7032的可灵活配置的稀疏矩阵乘算法NM-SpMM。NM-SpMM设计了一种高效的压缩偏移地址稀疏编码格式COA,避免了半结构化参数配置对稀疏数据访存计算的影响。基于COA编码,NM-SpMM对不同维度稀疏矩阵计算进行了细粒度优化。在FT-M7032单核上的实验结果表明,相较于稠密矩阵乘,NM-SpMM能获得1.73~21.00倍的加速,相较于采用CuSPARSE稀疏计算库的NVIDIA V100 GPU,能获得0.04~1.04倍的加速。 展开更多
关键词 深度神经网络 图形处理器 向量处理器 稀疏矩阵 流水线
在线阅读 下载PDF
基于麻雀算法优化支持向量机的阀门内漏诊断研究 被引量:2
12
作者 龚家乐 曹丽华 +1 位作者 李大才 司和勇 《汽轮机技术》 北大核心 2025年第2期110-112,126,共4页
由于数据驱动支持向量机模型在阀门泄漏诊断过程中各个参数不具备自适应能力,导致诊断能力较弱,提出了麻雀算法(Sparrow Search Algorithm,SSA)优化支持向量机(support vector machines,SVM)的阀门内漏诊断模型,并在诊断过程和模型诊断... 由于数据驱动支持向量机模型在阀门泄漏诊断过程中各个参数不具备自适应能力,导致诊断能力较弱,提出了麻雀算法(Sparrow Search Algorithm,SSA)优化支持向量机(support vector machines,SVM)的阀门内漏诊断模型,并在诊断过程和模型诊断性能上与标准SVM模型进行对比分析。结果表明:在诊断过程中,SSA-SVM阀门内漏诊断模型能够适时调整模型参数,并保持较高的诊断性能,多个泄漏诊断指标均优于标准模型。当泄漏诊断准确率优先级高于诊断时间时,SSA-SVM诊断模型拥有更好的阀门泄漏诊断能力。 展开更多
关键词 阀门泄漏 支持向量 麻雀优化算法 故障诊断
在线阅读 下载PDF
一种具有动态可重构数据流的混合矩阵向量处理器
13
作者 艾晨阳 赵乐川 +2 位作者 华涛 王新安 王颖 《计算机工程与科学》 北大核心 2025年第11期1912-1921,共10页
脉动阵列作为通用矩阵乘法(GEMM)算子的高能效加速器,受到了学术界和工业界广泛关注。然而,它往往占用大量面积,并且通常需要VPU单元配合使用,这种组合经常出现在神经网络加速器中。此外,它还存在时间空间利用率低、端到端场景性能有限... 脉动阵列作为通用矩阵乘法(GEMM)算子的高能效加速器,受到了学术界和工业界广泛关注。然而,它往往占用大量面积,并且通常需要VPU单元配合使用,这种组合经常出现在神经网络加速器中。此外,它还存在时间空间利用率低、端到端场景性能有限等问题。为了解决这些问题,通过结合脉动阵列与向量处理器,提出了一种脉动向量处理器HVSA。通过对VPU中存储、广播和通道间通信单元进行复用,HVSA可在阵列的形状和数据流方面进行可重构配置,可以在可接受的硬件面积开销的前提下,更有效地支持GEMM和向量运算。同时提出了适用于HVSA的端到端编译框架,包括基于MLIR的编译前端、数据流调度和兼容RISC-V向量扩展的编程模型。实验数据表明,与同等面积的脉动阵列相比,HVSA计算速度提升了30.30倍。在端到端应用中,相比同等面积的“VPU+脉动阵列”,HVSA的平均运行时间缩短为原来的约4.7%,能耗减少约58.7%。 展开更多
关键词 通用矩阵乘法 向量运算 脉动阵列 向量处理单元 数据流调度 编译器
在线阅读 下载PDF
融入概率矩阵分解模型的改进二部图推荐算法
14
作者 甘沛露 宋一豪 +1 位作者 朱晓雄 周支立 《运筹与管理》 北大核心 2025年第1期1-7,I0001-I0002,共7页
针对历史数据稀疏和分布不均衡影响二部图算法推荐效果的问题,一方面通过带约束的概率矩阵分解模型预测项目评分,设置权重对初始评分数据矩阵进行填充以扩充数据;另一方面,在传统二部图推荐算法的研究基础上,通过修正用户评分标准、融... 针对历史数据稀疏和分布不均衡影响二部图算法推荐效果的问题,一方面通过带约束的概率矩阵分解模型预测项目评分,设置权重对初始评分数据矩阵进行填充以扩充数据;另一方面,在传统二部图推荐算法的研究基础上,通过修正用户评分标准、融入时间效应因素、扩充用户评分信息,从而改进资源初始配置和分配方式以充分利用历史数据,实现对二部图推荐算法进行改进。最后,使用推荐算法领域常用的MovieLens数据集采用五折交叉验证的方式进行实验,并与传统二部图推荐算法进行比较。实验结果表明,每一步改进都提高了二部图算法的推荐效果,并且二部图算法与概率矩阵分解模型结合后,算法的推荐效果有显著提升。 展开更多
关键词 二部图推荐算法 数据稀疏性 概率矩阵分解 矩阵填充
在线阅读 下载PDF
面向RISC-V向量扩展的高性能算法库优化方法
15
作者 韩柳彤 张洪滨 +2 位作者 邢明杰 武延军 赵琛 《软件学报》 北大核心 2025年第9期3985-4005,共21页
高性能算法库可以通过向量化的方式高效地利用单指令多数据(SIMD)硬件的能力,从而提升其在CPU上的执行性能.其中,向量化的实现需要使用目标SIMD硬件的特定编程方法,而不同SIMD扩展的编程模型和编程方法均存在较大差异.为了避免优化算法... 高性能算法库可以通过向量化的方式高效地利用单指令多数据(SIMD)硬件的能力,从而提升其在CPU上的执行性能.其中,向量化的实现需要使用目标SIMD硬件的特定编程方法,而不同SIMD扩展的编程模型和编程方法均存在较大差异.为了避免优化算法在不同平台上的重复实现,提高算法库的可维护性,在高性能算法库的开发过程中通常需要引入硬件抽象层.由于目前主流SIMD扩展指令集均被设计为具有固定长度的向量寄存器,多数硬件抽象层也是基于定长向量的硬件特性而设计,无法包含RISC-V向量扩展所引入的可变向量寄存器长度的硬件特性.而若将RISC-V向量扩展视作定长向量扩展引入现有硬件抽象层设计中,会产生不必要的开销,造成性能损失.为此,提出了一种面向可变长向量扩展平台和固定长度SIMD扩展平台的硬件抽象层设计方法.基于此方法,重新设计和优化了OpenCV算法库中的通用内建函数,使其在兼容现有SIMD平台的基础上,更好地支持RISC-V向量扩展设备.将采用优化方法的OpenCV算法库与原版算法库进行性能比较,实验结果表明,运用该方法设计的通用内建函数能够将RISC-V向量扩展高效地融入算法库的硬件抽象层优化框架中,并在核心模块中获得3.93倍的性能提升,显著优化了高性能算法库在RISC-V设备上的执行性能,从而验证了该方法的有效性.此外,工作已经开源并被OpenCV社区集成到其源代码之中,证明了方法的实用性和应用价值. 展开更多
关键词 RISC-V向量扩展 数据级并行 高性能库优化 开源计算机视觉算法库(OpenCV)
在线阅读 下载PDF
改进的混沌人工蜂群算法-支持向量机漏钢预报模型
16
作者 张凯俊 张本国 +1 位作者 马棒棒 张瑞忠 《材料与冶金学报》 北大核心 2025年第3期237-242,共6页
支持向量机(SVM)是连铸漏钢预报的常用方法,针对支持向量机算法参数选取难度较大的问题,提出了一种改进的混沌人工蜂群算法-支持向量机(ICABC-SVM)漏钢预报模型.首先,利用伯努利(Bernoulli)混沌映射初始化蜂群种群,增加种群多样性;其次... 支持向量机(SVM)是连铸漏钢预报的常用方法,针对支持向量机算法参数选取难度较大的问题,提出了一种改进的混沌人工蜂群算法-支持向量机(ICABC-SVM)漏钢预报模型.首先,利用伯努利(Bernoulli)混沌映射初始化蜂群种群,增加种群多样性;其次,引入莱维(Levi)飞行策略,改进蜂群的搜索方式,扩大蜂群的搜索空间;最后,将支持向量机参数作为食物源进行寻优,并结合钢厂的历史生产数据,对ICABC-SVM模型进行训练和测试.结果表明:ICABC算法精度更高,具有良好的自适应能力;ICABC-SVM模型预报准确率为98.57%,报出率为100.00%,兼具实用性与可行性. 展开更多
关键词 漏钢预报 混沌映射 人工蜂群算法 莱维飞行 支持向量
在线阅读 下载PDF
基于群智能算法优化支持向量回归的挤压性围岩隧道变形预测
17
作者 徐剑波 姚天宇 +2 位作者 王力 朱颂阳 罗学东 《地质科技通报》 北大核心 2025年第5期317-326,共10页
隧道工程中,隧道设计和施工安全的前提是准确评估隧道围岩变形量。将萤火虫算法(FA)、鲸鱼优化算法(WOA)和灰狼优化算法(GWO)与优化支持向量回归(SVR)结合起来,并基于此构建了3种混合群智能优化预测模型,以预测挤压性围岩隧道变形量。... 隧道工程中,隧道设计和施工安全的前提是准确评估隧道围岩变形量。将萤火虫算法(FA)、鲸鱼优化算法(WOA)和灰狼优化算法(GWO)与优化支持向量回归(SVR)结合起来,并基于此构建了3种混合群智能优化预测模型,以预测挤压性围岩隧道变形量。构建了一个包含62个样本的数据库,选取了7种隧道及围岩初始参数作为预测模型输入参数,将隧道径向变形量作为输出量。选择决定系数(R^(2))、均方根误差(RMSE)、平均绝对误差(MAE)模型预测效果的评价指标。最后,使用归一化互信息法评估不同输入参数对隧道围岩变形预测结果的影响。研究结果表明,FA-SVR模型在训练阶段和测试阶段的预测性能优于GWO-SVR模型和WOA-SVR模型,训练集和测试集对应的R^(2)分别为0.9634和0.9648,RMSE分别为18.786和14.699,MAE分别为9.460和11.170,预测能力排序为:FA-SVR>WOA-SVR>GWO-SVR。萤火虫算法、鲸鱼优化算法和灰狼优化算法均能提高支持向量回归模型的预测性能,FA-SVR模型的预测效果最好,经过优化的混合预测模型性能显著优于经典模型。敏感性分析表明,节理密度是影响隧道围岩变形预测值的最重要参数。研究成果可为隧道工程安全控制提供重要参考。 展开更多
关键词 挤压性围岩隧道 变形预测 群智能优化算法 支持向量回归 归一化互信息
在线阅读 下载PDF
二次重构协方差矩阵稳健波束形成算法
18
作者 王博言 崔琳 +2 位作者 薛凯 张元帮 崔赢凯 《探测与控制学报》 北大核心 2025年第5期144-149,共6页
针对自适应波束形成算法需要解决在失配条件下的性能问题,提出一种对采样数据协方差矩阵进行二次重构并且改进导向矢量估计的稳健波束形成算法。首先求出采样数据协方差矩阵,其次用信号的先验知识得到重构的协方差矩阵,再次通过改进的... 针对自适应波束形成算法需要解决在失配条件下的性能问题,提出一种对采样数据协方差矩阵进行二次重构并且改进导向矢量估计的稳健波束形成算法。首先求出采样数据协方差矩阵,其次用信号的先验知识得到重构的协方差矩阵,再次通过改进的约束条件对协方差矩阵进行二次重构,其结果为最终的干扰加噪声协方差矩阵,最后利用改进的最优导向矢量估计法对导向矢量失配进行修正,求出波束方向图。仿真实验表明,该方法设计出的波束形成器在面对导向矢量失配、阵元扰动时有较好的应对能力。 展开更多
关键词 自适应波束形成 稳健波束形成算法 协方差矩阵二次重构 最优导向矢量估计
在线阅读 下载PDF
基于遗传和引导聚集算法优化支持向量机的白酒基酒品质评估方法
19
作者 庞婷婷 张贵宇 +4 位作者 刘科材 李晓平 庹先国 彭英杰 曾祥林 《食品科学》 北大核心 2025年第6期275-284,共10页
基酒组分具有复杂多样性,为提高其等级分类预测模型的精度和泛化能力,在基酒气相色谱-质谱数据基础上设计评价模型,提出一种结合遗传算法(genetic algorithm,GA)和引导聚集算法(Bootstrap aggregating,Bagging)优化支持向量机(support v... 基酒组分具有复杂多样性,为提高其等级分类预测模型的精度和泛化能力,在基酒气相色谱-质谱数据基础上设计评价模型,提出一种结合遗传算法(genetic algorithm,GA)和引导聚集算法(Bootstrap aggregating,Bagging)优化支持向量机(support vector machine,SVM)分类器的方法,以解决单一SVM分类器在分类精度和泛化能力的不足。研究使用Spearman相关性筛选了36种关键物质,选择核主成分分析法提取了12个核主成分,并使累计贡献率达到96.06%,将其作为模型输入。选择性能最优的径向基核函数支持向量机,使用对数据多样性适应较强的并行计算Bagging集成算法,构建Bagging-SVM分类器进行基酒等级分类,最后,通过GA优化Bagging-SVM分类器的参数(C、γ、N),构建GA-Bagging-SVM模型。结果显示,GA-Bagging-SVM模型的准确率、精确度、召回率、F1-Score分别为96.77%、96.90%、96.77%、96.78%,优于Bagging-SVM和SVM模型,相比单一SVM模型提升了6.45%、5.61%、6.45%、6.42%,比Bagging-SVM模型提升了3.22%、2.29%、3.22%和3.15%。该方法可作为白酒基酒品质评估模型的优化方法。 展开更多
关键词 基酒 支持向量 引导聚集算法 遗传算法 分类预测
在线阅读 下载PDF
求解格上最短向量问题的自适应遗传算法
20
作者 毕经国 苏磊 王林 《密码学报(中英文)》 北大核心 2025年第1期215-226,共12页
最短向量问题(shortest vector problem,SVP)是格密码中一个经典的困难问题.丁丹等于2015年提出了首个解决最短向量问题的遗传算法,该算法利用BKZ约化基的正交表示来搜索格点组成的空间,能够高效地找到格内最短向量.由于该算法采用固定... 最短向量问题(shortest vector problem,SVP)是格密码中一个经典的困难问题.丁丹等于2015年提出了首个解决最短向量问题的遗传算法,该算法利用BKZ约化基的正交表示来搜索格点组成的空间,能够高效地找到格内最短向量.由于该算法采用固定的交叉率和变异率,容易陷入局部最优解,且没有充分利用BKZ约化基正交表示下短向量的稀疏特征.本文从跳出局部最优解、提升算法收敛速度以及提高成功概率三个维度改进了该算法的SVP智能求解方案.首先,本文引入了动态计算交叉率和变异率的模块,主要基于个体质量与种群收敛程度两个维度来控制交叉率以及变异率,从而有效避免算法陷入局部最优解.其次,设计了一种自适应变异策略,从基因层面充分利用了BKZ约化基下短向量正交整数表示的稀疏性,显著加快了整个算法的收敛速度.最后,提出了基于多种群并行的遗传算法,进一步提高了概率算法的成功率.通过这些改进,本文的算法在求解SVP问题时表现出更高的效率和更强的鲁棒性. 展开更多
关键词 格理论 遗传算法 最短向量问题
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部