期刊文献+
共找到7,996篇文章
< 1 2 250 >
每页显示 20 50 100
面向SW26010-Pro众核处理器的新型矩阵存储格式及稀疏矩阵向量乘(SpMV)算法研究
1
作者 王萃 刘芳芳 +2 位作者 马文静 赵玉文 胡力娟 《计算机学报》 北大核心 2025年第6期1290-1304,共15页
稀疏矩阵向量乘(Sparse Matrix-Vector Multiplication,SpMV)是高性能计算、人工智能大模型领域中的关键操作,其性能通常对应用程序整体性能的提升具有重要影响。高效的稀疏矩阵存储格式是影响SpMV性能的重要因素,然而,现有的稀疏矩阵... 稀疏矩阵向量乘(Sparse Matrix-Vector Multiplication,SpMV)是高性能计算、人工智能大模型领域中的关键操作,其性能通常对应用程序整体性能的提升具有重要影响。高效的稀疏矩阵存储格式是影响SpMV性能的重要因素,然而,现有的稀疏矩阵存储格式主要通过压缩零元素以减少访存,未充分利用非零元素的数值规律,因此仍有进一步压缩和优化的空间。本文通过对压缩稀疏行(Compressed Sparse Row,CSR)存储格式中非零元数组内的重复元素进行进一步的压缩,提出了一种新型的稀疏矩阵存储格式(Further Compressed Sparse Row,FCSR),并设计了从CSR到FCSR格式转换的异构并行算法,以尽量减少格式转换带来的开销。同时,本文面向SW26010-Pro众核处理器,设计了基于FCSR存储格式的SpMV异构并行算法,对SpMV进行了细粒度的任务划分和并行优化设计,探究了五种向量x的间接访存方式,并通过双缓冲技术对算法进行了优化。最后,本文选用SuiteSparse矩阵集中的稀疏矩阵进行了测试,实验结果表明,本文提出的基于FCSR存储格式的异构众核SpMV算法相较于主核版SpMV算法具有明显的性能提升,最高加速比达到43.11,平均加速比为7.56,测试矩阵最高带宽利用率达到了91.13%,平均带宽利用率为26.27%。另外,本文对基于FCSR存储格式和CSR存储格式的SpMV算法性能进行了比较,在两者均得到充分优化的前提下,基于FCSR存储格式的SpMV算法相较于基于CSR存储格式的SpMV算法性能的平均加速比达到1.19。 展开更多
关键词 稀疏矩阵向量 SW26010-Pro众核处理器 新型矩阵存储格式 并行优化 双缓冲技术
在线阅读 下载PDF
输入感知的通用矩阵-向量乘算法在Hygon DCU的自适应性能优化
2
作者 李庆 贾海鹏 +1 位作者 张云泉 张思佳 《计算机科学》 北大核心 2025年第4期291-300,共10页
GEMV(通用矩阵-向量乘法函数)是BLAS(基础线性代数子程序)算法库的核心组成部分,广泛用于计算机科学、工程计算和数学计算等领域。当前,随着国产Hygon DCU版本的不断迭代升级,Hygon DCU与传统GPU生产商之间也存在一定的竞争优势;随着GEM... GEMV(通用矩阵-向量乘法函数)是BLAS(基础线性代数子程序)算法库的核心组成部分,广泛用于计算机科学、工程计算和数学计算等领域。当前,随着国产Hygon DCU版本的不断迭代升级,Hygon DCU与传统GPU生产商之间也存在一定的竞争优势;随着GEMV应用领域的不断扩大,GEMV的输入特征体现出多样化的趋势。在这种背景下,单纯靠一种优化方法,无法实现GEMV算法在GPU计算平台上所有输入情况下的高性能。因此,在访存优化、指令重排、并行规约、共享内存、线程排布等传统优化手段的基础上,提出了一种输入感知的性能自适应优化方法,其能够根据输入矩阵的不同规模和形状自动调整计算kernel的实现方式以达到最佳性能,显著提高了GEMV在Hygon DCU上的性能。实验结果表明,在Hygon DCU Z100SM上,输入感知的通用矩阵-向量乘算法的整体性能明显优于RocBLAS库中的相关算法,对于不同的矩阵输入规模,性能最大提升为RocBLAS库中对应算法的3.0203倍。 展开更多
关键词 通用矩阵-向量乘法 DCU 基础线性代数子程序函数库 自适应调优 性能优化
在线阅读 下载PDF
基于目标扰动的本地化差分隐私矩阵分解推荐算法 被引量:2
3
作者 王永 罗陈红 +1 位作者 邓江洲 高明星 《计算机学报》 北大核心 2025年第2期451-462,共12页
推荐系统作为有效应对信息过载的工具被广泛应用在电子商务、社交媒体和新闻资讯等领域中。矩阵分解具有泛化能力强和计算效率高的优点,是构建推荐系统的主流算法之一。为提高推荐质量,推荐服务器需要收集大量用户数据用于推荐模型的训... 推荐系统作为有效应对信息过载的工具被广泛应用在电子商务、社交媒体和新闻资讯等领域中。矩阵分解具有泛化能力强和计算效率高的优点,是构建推荐系统的主流算法之一。为提高推荐质量,推荐服务器需要收集大量用户数据用于推荐模型的训练。由于推荐服务器不是完全可信的,向服务器共享用户数据会对用户隐私构成极大的威胁。如何构建一个在保护用户隐私的同时,还能确保推荐质量和准确性的系统,成为了一个热门的研究话题。本地化差分隐私是一种分布式的隐私保护机制,它从中心化差分隐私中发展而来,旨在解决服务器不可信场景下的数据的安全收集和分析。这种框架通过精确的数学证明来确保隐私保护的强度。目前,已经有研究工作将本地化差分隐私引入推荐系统,目的是在推荐效果可接受的情况下,确保用户隐私数据的安全。然而,这些研究还面临一些挑战。首先,隐私保护的范围有限。目前的方法大多只关注显式数据的具体数值,认为这是用户的隐私信息。事实上,攻击者可以通过检查数据是否包含在数据集中,来推测用户的隐私信息。其次,推荐质量较低。本地化差分隐私通过引入扰动来保护用户隐私,但这种方法会导致扰动幅度过大和误差累积,进而影响推荐质量。在推荐服务器不可信场景下,本文提出一种基于本地化差分隐私的矩阵分解推荐算法。首先,该算法将评分数值和评分存在性同时作为隐私保护的对象,为用户提供全面的隐私保护。其次,本算法采用目标扰动方法,添加的噪声量不会随着迭代次数增加而增加,有效避免模型训练过程中噪声累积的问题,保证模型训练的有效性。最后,针对分布式场景下多轮迭代导致的中间参数泄露问题,以无放回方式将采样的模型梯度元素发送给推荐服务器,用于模型训练。本文从理论上证明了所提算法满足本地化差分隐私。对所提算法的效用分析证明本文算法在保证有效的推荐质量的同时,能够实现对用户隐私数据的保护。实验结果表明本文算法极大地提高了隐私保护推荐算法的性能,本文算法在公开数据集上的误差下降幅度平均可达18%,在推荐领域数据隐私保护中展现出良好的应用价值。 展开更多
关键词 矩阵分解 本地化差分隐私 目标扰动 推荐算法 隐私保护
在线阅读 下载PDF
基于监督学习的稀疏矩阵乘算法优选
4
作者 彭林 张鹏 +2 位作者 陈俊峰 唐滔 黄春 《计算机工程与科学》 北大核心 2025年第3期381-391,共11页
稀疏矩阵乘算法中主流的row-by-row计算公式上的SPA、HASH、ESC 3种稀疏矩阵乘实现算法,在对不同的稀疏矩阵进行计算时性能差异显著,在不同非零元规模上单一算法不总是能取得最佳性能,而且单一算法与最优选择存在明显差距。为此,提出了... 稀疏矩阵乘算法中主流的row-by-row计算公式上的SPA、HASH、ESC 3种稀疏矩阵乘实现算法,在对不同的稀疏矩阵进行计算时性能差异显著,在不同非零元规模上单一算法不总是能取得最佳性能,而且单一算法与最优选择存在明显差距。为此,提出了一种基于机器学习的最优稀疏矩阵乘算法选择模型,以给定矩阵集作为数据源,抽取稀疏矩阵的特征,并使用SPA、HASH、ESC计算获得的性能数据进行训练和验证,获得的模型能够仅使用稀疏矩阵的特征即可完成对新数据集的算法优选。实验结果表明,该模型可以获得91%以上的预测准确率,平均性能达到最优选择的98%,是单一算法性能的1.55倍以上,并且可在实际库函数中使用,具有良好的泛化能力和实用价值。 展开更多
关键词 稀疏矩阵 SpGEMM SPA算法 HASH算法 ESC算法 机器学习
在线阅读 下载PDF
基于缓存数据重用的稀疏矩阵向量乘序列优化
5
作者 徐传福 邱昊中 车永刚 《计算机研究与发展》 北大核心 2025年第6期1434-1442,共9页
稀疏线性方程组求解等高性能计算应用常常涉及稀疏矩阵向量乘(SpMV)序列Ax,A2x,…,Asx的计算.上述SpMV序列操作又称为稀疏矩阵幂函数(matrix power kernel,MPK).由于MPK执行多次SpMV且稀疏矩阵保持不变,在缓存(cache)中重用稀疏矩阵,可... 稀疏线性方程组求解等高性能计算应用常常涉及稀疏矩阵向量乘(SpMV)序列Ax,A2x,…,Asx的计算.上述SpMV序列操作又称为稀疏矩阵幂函数(matrix power kernel,MPK).由于MPK执行多次SpMV且稀疏矩阵保持不变,在缓存(cache)中重用稀疏矩阵,可避免每次执行SpMV均从主存加载A,从而缓解SpMV访存受限问题,提升MPK性能.但缓存数据重用会导致相邻SpMV操作之间的数据依赖,现有MPK优化多针对单次SpMV调用,或在实现数据重用时引入过多额外开销.提出了缓存感知的MPK(cache-awareMPK,Ca-MPK),基于稀疏矩阵的依赖图,设计了体系结构感知的递归划分方法,将依赖图划分为适合缓存大小的子图/子矩阵,通过构建分割子图解耦数据依赖,根据特定顺序在子矩阵上调度执行SpMV,实现缓存数据重用.测试结果表明,Ca-MPK相对于Intel OneMKL库和最新MPK实现,平均性能提升分别多达约1.57倍和1.40倍. 展开更多
关键词 稀疏矩阵向量 矩阵幂函数 缓存数据重用 数据依赖 稀疏线性方程组求解
在线阅读 下载PDF
基于改进金豺算法优化最小二乘法支持向量机的磨削表面粗糙度预测
6
作者 朱文博 张淑权 +1 位作者 张梦梦 迟玉伦 《表面技术》 北大核心 2025年第16期165-181,共17页
目的磨削过程中粗糙度直接影响产品质量,为有效预测工件磨削表面粗糙度,基于声发射和振动信号提出一种改进金豺算法(IGJO)优化最小二乘法支持向量(LSSVM)的磨削表面粗糙度预测方法。方法为增强信号特征与磨削表面粗糙度相关性,利用皮尔... 目的磨削过程中粗糙度直接影响产品质量,为有效预测工件磨削表面粗糙度,基于声发射和振动信号提出一种改进金豺算法(IGJO)优化最小二乘法支持向量(LSSVM)的磨削表面粗糙度预测方法。方法为增强信号特征与磨削表面粗糙度相关性,利用皮尔逊相关分析和主成分分析(PCA)对信号特征进行筛选,降低特征之间的多重共线性,降低模型复杂度;为改善磨削表面粗糙度预测模型的性能,对于金豺算法(GJO)易陷入局部最优问题,在GJO基础上引入佳点集初始化种群、非线性能量因子更新策略以及融合鲸鱼优化算法改进搜索策略,提升算法的初始种群多样性、收敛精度和全局搜索能力;为提高磨削表面粗糙度预测模型有效性,利用IGJO对LSSVM进行参数寻优,建立磨削表面粗糙度预测模型。结果通过轴承套圈内滚道磨削加工实验数据进行验证,结果表明IGJO-LSSVM磨削表面粗糙度预测模型能有效预测粗糙度值,预测精度为95.223%,RMSE值为0.0133,MAPE值为4.776%,R2值为0.956,均优于GJO-LSSVM、LSSVM和BP神经网络模型。结论通过IGJO优化后的LSSVM模型可实现磨削表面粗糙度有效预测,同时能够避免传统LSSVM容易陷入局部极小值的问题,对提高产品磨削质量具有重要意义。 展开更多
关键词 磨削表面粗糙度 轴承套圈 最小二乘法支持向量 金豺算法
在线阅读 下载PDF
基于矩阵画像和Louvain社区发现算法的关键核心技术识别研究
7
作者 万校基 赖静 +2 位作者 牟莹禧 朱志国 张丽萍 《情报学报》 北大核心 2025年第7期903-914,共12页
针对现有关键核心技术识别方法较少考虑时间因素和较难解读识别结果等问题,本文提出一种基于矩阵画像(matrix profile,MP)和Louvain社区发现算法的关键核心技术识别方法。该方法基于IPC(international patent classification)小类权重... 针对现有关键核心技术识别方法较少考虑时间因素和较难解读识别结果等问题,本文提出一种基于矩阵画像(matrix profile,MP)和Louvain社区发现算法的关键核心技术识别方法。该方法基于IPC(international patent classification)小类权重和词频分析法识别目标领域热点技术主题,结合高频IPC小类时间序列和MP算法构建技术关联网络,借助Louvain算法和社会网络分析法识别目标领域初始关键核心技术主题。基于特征筛选关键核心技术主题,并通过对技术关联子网络、原始专利数据、相关政策文件和期刊文献的深层次解读来识别目标领域关键核心技术。通过对incoPat专利数据库中2014—2023年物流领域的授权专利进行数据处理和挖掘发现,本文方法能有效识别物流领域关键核心技术,不仅有助于推动行业技术突破和创新,亦可提升国家在全球产业链和价值链中的地位。 展开更多
关键词 关键核心技术 矩阵画像 社区发现算法 技术关联网络 结构洞
在线阅读 下载PDF
方向余弦矩阵的特征值与特征向量及其性质研究
8
作者 张建书 陈菲菲 《南京理工大学学报》 北大核心 2025年第1期25-31,共7页
用来描述两右手笛卡尔直角坐标系相对方位的方向余弦矩阵是计算力学、计算图形学、导航与控制、机器人等领域中最基本的运算量之一。现有文献已经阐明:2个方位不同的坐标系之间的方向余弦矩阵有3个模为1的特征值,其中一个是实数1,其余2... 用来描述两右手笛卡尔直角坐标系相对方位的方向余弦矩阵是计算力学、计算图形学、导航与控制、机器人等领域中最基本的运算量之一。现有文献已经阐明:2个方位不同的坐标系之间的方向余弦矩阵有3个模为1的特征值,其中一个是实数1,其余2个为一对共轭复数;实特征值1表明两坐标系的相对方位可以通过一次简单转动来描述,与实特征值1对应的特征向量与该简单转动的转轴共线;复特征值指数的模等于该简单转动的转角。该文给出了上述实特征值1对应的特征向量性质的几何证明,并重点研究了方向余弦矩阵复特征值对应的复特征向量的性质,通过证明得出:复特征向量的虚部与实部相互垂直且模相等,虚部与实部的叉积与简单转动的转轴共线且同向。最后通过数值算例对方向余弦矩阵的特征值与特征向量的上述性质进行了验证。 展开更多
关键词 方向余弦矩阵 特征值 特征向量 复数特征向量 简单转动
在线阅读 下载PDF
微细导线电容矩阵边界元算法的关键技术研究
9
作者 胡玉生 牛梦园 +1 位作者 何俪瑾 区耀权 《电波科学学报》 北大核心 2025年第3期526-535,共10页
研究了复杂微细导线电容矩阵提取边界元法(boundary element method,BEM)的边界离散问题以及增强计算精度和数值稳定性的有效措施,分析了开阔边界尺寸、开阔边界离散、导线离散对计算精度的影响以及伪解、矩阵奇异性问题,提出了基于导... 研究了复杂微细导线电容矩阵提取边界元法(boundary element method,BEM)的边界离散问题以及增强计算精度和数值稳定性的有效措施,分析了开阔边界尺寸、开阔边界离散、导线离散对计算精度的影响以及伪解、矩阵奇异性问题,提出了基于导线离散迭代和开阔边界迭代两阶段自动迭代边界元算法(automatic iterative boundary element method,AIBEM),并结合实例阐述了全域法和区域分解法两种多层介质问题系数矩阵生成方法。研究结果表明,边界环内生成的系数矩阵存在误差均衡协调问题,对复杂模型需合理选择各线段离散单元数及开阔边界尺寸,通过AIBEM可以获得经济的离散参数,有效避免矩阵奇异性,并提高收敛稳定性。将计算结果与有限元法、解析法、传输线法、矩量法进行了对比分析,证实了算法的可靠性。 展开更多
关键词 微细导线 电容矩阵 边界元法(BEM) 开阔边界 边界离散 多层介质 迭代算法
在线阅读 下载PDF
NM-SpMM:面向国产异构向量处理器的半结构化稀疏矩阵乘算法
10
作者 姜晶菲 何源宏 +2 位作者 许金伟 许诗瑶 钱希福 《计算机工程与科学》 CSCD 北大核心 2024年第7期1141-1150,共10页
深度神经网络在自然语言处理、计算机视觉等领域取得了优异的成果,由于智能应用处理数据规模的增长和大模型的快速发展,对深度神经网络的推理性能要求越来越高,N∶M半结构化稀疏化技术成为平衡算力需求和应用效果的热点技术之一。国产... 深度神经网络在自然语言处理、计算机视觉等领域取得了优异的成果,由于智能应用处理数据规模的增长和大模型的快速发展,对深度神经网络的推理性能要求越来越高,N∶M半结构化稀疏化技术成为平衡算力需求和应用效果的热点技术之一。国产异构向量处理器FT-M7032为智能模型处理中的数据并行和指令并行开发提供了较大空间。针对N∶M半结构化稀疏模型计算稀疏模式多样性,提出了一种面向FT-M7032的可灵活配置的稀疏矩阵乘算法NM-SpMM。NM-SpMM设计了一种高效的压缩偏移地址稀疏编码格式COA,避免了半结构化参数配置对稀疏数据访存计算的影响。基于COA编码,NM-SpMM对不同维度稀疏矩阵计算进行了细粒度优化。在FT-M7032单核上的实验结果表明,相较于稠密矩阵乘,NM-SpMM能获得1.73~21.00倍的加速,相较于采用CuSPARSE稀疏计算库的NVIDIA V100 GPU,能获得0.04~1.04倍的加速。 展开更多
关键词 深度神经网络 图形处理器 向量处理器 稀疏矩阵 流水线
在线阅读 下载PDF
基于麻雀算法优化支持向量机的阀门内漏诊断研究 被引量:1
11
作者 龚家乐 曹丽华 +1 位作者 李大才 司和勇 《汽轮机技术》 北大核心 2025年第2期110-112,126,共4页
由于数据驱动支持向量机模型在阀门泄漏诊断过程中各个参数不具备自适应能力,导致诊断能力较弱,提出了麻雀算法(Sparrow Search Algorithm,SSA)优化支持向量机(support vector machines,SVM)的阀门内漏诊断模型,并在诊断过程和模型诊断... 由于数据驱动支持向量机模型在阀门泄漏诊断过程中各个参数不具备自适应能力,导致诊断能力较弱,提出了麻雀算法(Sparrow Search Algorithm,SSA)优化支持向量机(support vector machines,SVM)的阀门内漏诊断模型,并在诊断过程和模型诊断性能上与标准SVM模型进行对比分析。结果表明:在诊断过程中,SSA-SVM阀门内漏诊断模型能够适时调整模型参数,并保持较高的诊断性能,多个泄漏诊断指标均优于标准模型。当泄漏诊断准确率优先级高于诊断时间时,SSA-SVM诊断模型拥有更好的阀门泄漏诊断能力。 展开更多
关键词 阀门泄漏 支持向量 麻雀优化算法 故障诊断
在线阅读 下载PDF
融入概率矩阵分解模型的改进二部图推荐算法
12
作者 甘沛露 宋一豪 +1 位作者 朱晓雄 周支立 《运筹与管理》 北大核心 2025年第1期1-7,I0001-I0002,共7页
针对历史数据稀疏和分布不均衡影响二部图算法推荐效果的问题,一方面通过带约束的概率矩阵分解模型预测项目评分,设置权重对初始评分数据矩阵进行填充以扩充数据;另一方面,在传统二部图推荐算法的研究基础上,通过修正用户评分标准、融... 针对历史数据稀疏和分布不均衡影响二部图算法推荐效果的问题,一方面通过带约束的概率矩阵分解模型预测项目评分,设置权重对初始评分数据矩阵进行填充以扩充数据;另一方面,在传统二部图推荐算法的研究基础上,通过修正用户评分标准、融入时间效应因素、扩充用户评分信息,从而改进资源初始配置和分配方式以充分利用历史数据,实现对二部图推荐算法进行改进。最后,使用推荐算法领域常用的MovieLens数据集采用五折交叉验证的方式进行实验,并与传统二部图推荐算法进行比较。实验结果表明,每一步改进都提高了二部图算法的推荐效果,并且二部图算法与概率矩阵分解模型结合后,算法的推荐效果有显著提升。 展开更多
关键词 二部图推荐算法 数据稀疏性 概率矩阵分解 矩阵填充
在线阅读 下载PDF
改进的混沌人工蜂群算法-支持向量机漏钢预报模型
13
作者 张凯俊 张本国 +1 位作者 马棒棒 张瑞忠 《材料与冶金学报》 北大核心 2025年第3期237-242,共6页
支持向量机(SVM)是连铸漏钢预报的常用方法,针对支持向量机算法参数选取难度较大的问题,提出了一种改进的混沌人工蜂群算法-支持向量机(ICABC-SVM)漏钢预报模型.首先,利用伯努利(Bernoulli)混沌映射初始化蜂群种群,增加种群多样性;其次... 支持向量机(SVM)是连铸漏钢预报的常用方法,针对支持向量机算法参数选取难度较大的问题,提出了一种改进的混沌人工蜂群算法-支持向量机(ICABC-SVM)漏钢预报模型.首先,利用伯努利(Bernoulli)混沌映射初始化蜂群种群,增加种群多样性;其次,引入莱维(Levi)飞行策略,改进蜂群的搜索方式,扩大蜂群的搜索空间;最后,将支持向量机参数作为食物源进行寻优,并结合钢厂的历史生产数据,对ICABC-SVM模型进行训练和测试.结果表明:ICABC算法精度更高,具有良好的自适应能力;ICABC-SVM模型预报准确率为98.57%,报出率为100.00%,兼具实用性与可行性. 展开更多
关键词 漏钢预报 混沌映射 人工蜂群算法 莱维飞行 支持向量
在线阅读 下载PDF
基于遗传和引导聚集算法优化支持向量机的白酒基酒品质评估方法
14
作者 庞婷婷 张贵宇 +4 位作者 刘科材 李晓平 庹先国 彭英杰 曾祥林 《食品科学》 北大核心 2025年第6期275-284,共10页
基酒组分具有复杂多样性,为提高其等级分类预测模型的精度和泛化能力,在基酒气相色谱-质谱数据基础上设计评价模型,提出一种结合遗传算法(genetic algorithm,GA)和引导聚集算法(Bootstrap aggregating,Bagging)优化支持向量机(support v... 基酒组分具有复杂多样性,为提高其等级分类预测模型的精度和泛化能力,在基酒气相色谱-质谱数据基础上设计评价模型,提出一种结合遗传算法(genetic algorithm,GA)和引导聚集算法(Bootstrap aggregating,Bagging)优化支持向量机(support vector machine,SVM)分类器的方法,以解决单一SVM分类器在分类精度和泛化能力的不足。研究使用Spearman相关性筛选了36种关键物质,选择核主成分分析法提取了12个核主成分,并使累计贡献率达到96.06%,将其作为模型输入。选择性能最优的径向基核函数支持向量机,使用对数据多样性适应较强的并行计算Bagging集成算法,构建Bagging-SVM分类器进行基酒等级分类,最后,通过GA优化Bagging-SVM分类器的参数(C、γ、N),构建GA-Bagging-SVM模型。结果显示,GA-Bagging-SVM模型的准确率、精确度、召回率、F1-Score分别为96.77%、96.90%、96.77%、96.78%,优于Bagging-SVM和SVM模型,相比单一SVM模型提升了6.45%、5.61%、6.45%、6.42%,比Bagging-SVM模型提升了3.22%、2.29%、3.22%和3.15%。该方法可作为白酒基酒品质评估模型的优化方法。 展开更多
关键词 基酒 支持向量 引导聚集算法 遗传算法 分类预测
在线阅读 下载PDF
求解格上最短向量问题的自适应遗传算法
15
作者 毕经国 苏磊 王林 《密码学报(中英文)》 北大核心 2025年第1期215-226,共12页
最短向量问题(shortest vector problem,SVP)是格密码中一个经典的困难问题.丁丹等于2015年提出了首个解决最短向量问题的遗传算法,该算法利用BKZ约化基的正交表示来搜索格点组成的空间,能够高效地找到格内最短向量.由于该算法采用固定... 最短向量问题(shortest vector problem,SVP)是格密码中一个经典的困难问题.丁丹等于2015年提出了首个解决最短向量问题的遗传算法,该算法利用BKZ约化基的正交表示来搜索格点组成的空间,能够高效地找到格内最短向量.由于该算法采用固定的交叉率和变异率,容易陷入局部最优解,且没有充分利用BKZ约化基正交表示下短向量的稀疏特征.本文从跳出局部最优解、提升算法收敛速度以及提高成功概率三个维度改进了该算法的SVP智能求解方案.首先,本文引入了动态计算交叉率和变异率的模块,主要基于个体质量与种群收敛程度两个维度来控制交叉率以及变异率,从而有效避免算法陷入局部最优解.其次,设计了一种自适应变异策略,从基因层面充分利用了BKZ约化基下短向量正交整数表示的稀疏性,显著加快了整个算法的收敛速度.最后,提出了基于多种群并行的遗传算法,进一步提高了概率算法的成功率.通过这些改进,本文的算法在求解SVP问题时表现出更高的效率和更强的鲁棒性. 展开更多
关键词 格理论 遗传算法 最短向量问题
在线阅读 下载PDF
一类伪Jacobi矩阵的保结构构造算法
16
作者 徐伟孺 蒲会 +1 位作者 彭欢 沈芮西 《安徽大学学报(自然科学版)》 北大核心 2025年第2期20-27,共8页
研究了一类伪Jacobi矩阵的逆特征值问题.通过探讨该伪Jacobi矩阵的谱分布性质,提出了该问题的一种新的表述形式.随后,研究了该问题解的唯一性,给出了有解的充要条件和具体的保结构构造算法.最后,通过数值算例验证了该问题解的唯一性及... 研究了一类伪Jacobi矩阵的逆特征值问题.通过探讨该伪Jacobi矩阵的谱分布性质,提出了该问题的一种新的表述形式.随后,研究了该问题解的唯一性,给出了有解的充要条件和具体的保结构构造算法.最后,通过数值算例验证了该问题解的唯一性及算法的可行性. 展开更多
关键词 伪Jacobi矩阵 保结构算法 逆特征值问题 谱分布
在线阅读 下载PDF
多阶特征向量融合的深度神经网络产品推荐算法
17
作者 李克潮 张继成 《计算机工程与设计》 北大核心 2025年第6期1742-1749,共8页
为充分利用用户和产品的信息,缓解数据稀疏、冷启动的问题,提出一种多阶特征向量融合的深度神经网络产品推荐(MFVF)。引入预训练模型(BERT)提升对产品描述文档、评论文本的语义理解。根据产品类别、社交关系,挖掘基于类别与社交关系的... 为充分利用用户和产品的信息,缓解数据稀疏、冷启动的问题,提出一种多阶特征向量融合的深度神经网络产品推荐(MFVF)。引入预训练模型(BERT)提升对产品描述文档、评论文本的语义理解。根据产品类别、社交关系,挖掘基于类别与社交关系的用户、产品潜在一阶特征向量。连同用户和产品评分的潜在一阶特征向量,经过广义矩阵分解(GMF)层构建二阶特征向量,作为深度神经网络隐藏层的输入。对深度神经网络隐藏层输出的高阶特征向量进行拼接,得到用户对产品的预测偏好。通过对比实验,验证了所提算法推荐质量得到较大提升。 展开更多
关键词 产品描述文档 评论文本 社交网络 深度神经网络 深度学习 推荐算法 预训练模型 多阶特征向量
在线阅读 下载PDF
基于向量和矩阵的挖掘关联规则的高效算法 被引量:12
18
作者 牛小飞 石冰 《计算机工程与应用》 CSCD 北大核心 2004年第12期170-173,共4页
挖掘关联规则是数据挖掘中一个重要的课题,产生频繁项目集是其中的一个关键步骤。文章提出了一种基于向量和矩阵的挖掘算法AVM,并将该算法与两种经典的发现频繁项目集的算法进行了比较。该算法只需要对数据库扫描一遍,并且存放辅助信息... 挖掘关联规则是数据挖掘中一个重要的课题,产生频繁项目集是其中的一个关键步骤。文章提出了一种基于向量和矩阵的挖掘算法AVM,并将该算法与两种经典的发现频繁项目集的算法进行了比较。该算法只需要对数据库扫描一遍,并且存放辅助信息所需要的空间也少。实验表明与原先的算法相比,该算法的效率较好。 展开更多
关键词 数据挖掘 关联规则 频繁项集 基于向量和矩阵的算法
在线阅读 下载PDF
基于GPU对角稀疏矩阵向量乘法的动态划分算法
19
作者 涂进兴 李志雄 黄建强 《计算机应用》 CSCD 北大核心 2024年第11期3521-3529,共9页
在图形处理器(GPU)上实现对角稀疏矩阵向量乘法(SpMV)可以充分利用GPU的并行计算能力,并加速矩阵向量乘法;然而,相关主流算法存在零元填充数据多、计算效率低的问题。针对上述问题,提出一种对角SpMV算法DIA-Dynamic(DIAgonal-Dynamic)... 在图形处理器(GPU)上实现对角稀疏矩阵向量乘法(SpMV)可以充分利用GPU的并行计算能力,并加速矩阵向量乘法;然而,相关主流算法存在零元填充数据多、计算效率低的问题。针对上述问题,提出一种对角SpMV算法DIA-Dynamic(DIAgonal-Dynamic)。首先,设计一种全新的动态划分策略,根据矩阵的不同特征进行分块,在保证GPU高计算效率的同时大幅减少零元填充,去除冗余计算量;其次,提出一种对角稀疏矩阵存储格式BDIA(Block DIAgonal)存储分块数据,并调整数据布局,提高GPU上的访存性能;最后,基于GPU的底层进行条件分支优化,以减少分支判断,并使用动态共享内存解决向量的不规则访问问题。DIA-Dynamic与前沿Tile SpMV算法相比,平均加速比达到了1.88;与前沿BRCSD(Diagonal Compressed Storage based on Row-Blocks)-Ⅱ算法相比,平均零元填充减少了43%,平均加速比达到了1.70。实验结果表明,DIA-Dynamic能够有效提高GPU上对角SpMV的计算效率,缩短计算时间,提升程序性能。 展开更多
关键词 图形处理器 对角稀疏矩阵 稀疏矩阵向量乘法 动态划分 共享内存
在线阅读 下载PDF
基于斑马算法优化支持向量回归机模型预测页岩地层压力 被引量:3
20
作者 赵军 李勇 +2 位作者 文晓峰 徐文远 焦世祥 《岩性油气藏》 CAS CSCD 北大核心 2024年第6期12-22,共11页
针对陇东地区三叠系延长组7段(长7段)页岩孔隙结构复杂、非均质性强、地层压力预测精度较低等问题,提出了一种基于斑马算法优化支持向量回归机(ZOA-SVR)模型预测地层压力的方法,并在实际钻井中进行了应用,将预测结果与基于机器算法的模... 针对陇东地区三叠系延长组7段(长7段)页岩孔隙结构复杂、非均质性强、地层压力预测精度较低等问题,提出了一种基于斑马算法优化支持向量回归机(ZOA-SVR)模型预测地层压力的方法,并在实际钻井中进行了应用,将预测结果与基于机器算法的模型和常规地层压力预测方法结果进行了对比。研究结果表明:①ZOA-SVR模型以实测地层压力数据为目标变量,优选与陇东地区长7段页岩地层压力数据关联度达到0.70以上的深度、声波时差、密度、补偿中子、自然伽马、深侧向电阻率、泥质含量等7个参数作为输入特征参数,设置训练样本数为40,交叉验证折数为5,初始化斑马种群数量为10,最大迭代次数为70,对惩罚因子和核参数进行优化并建模,参数优化后拟合优度指标R2达到0.942,模型预测的地层压力数据在训练集和测试集上的绝对误差均低于1 MPa,预测测试集地层压力数据与实测压力数据的平均相对误差为2.42%。②ZOA-SVR模型在研究区长7段地层压力预测中优势明显,比基于粒子群优化算法、灰狼算法和蚁群算法的模型具有更好的参数调节及优化能力,R2分别提高了0.209,0.327,0.142;比等效深度法、Eaton法、有效应力法预测的地层压力精度更高,相对误差分别降低了32.53%,15.31%,5.91%。③ZOA-SVR模型在实际钻井中的应用结果显示,研究区长7段地层压力在垂向上分布较稳定,泥页岩段的地层压力高于砂岩段,地层压力系数主要为0.80~0.90,整体上属于异常低压环境,与实际地层情况相符。 展开更多
关键词 页岩 地层压力 斑马优化算法 支持向量回归机 机器学习 测井曲线 长7段 三叠系 陇东地区
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部