期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
面向时间有序事务数据的聚簇频繁模式挖掘
1
作者 王少鹏 牛超煜 《软件学报》 北大核心 2025年第5期2342-2361,共20页
首次对时间有序事务数据中聚簇频繁模式的挖掘问题进行研究.为了解决Naive算法处理该问题时存在冗余运算的问题,提出一种改进的聚簇频繁模式挖掘算法ICFPM(improved cluster frequent pattern mining).该算法使用2种优化策略,一方面可... 首次对时间有序事务数据中聚簇频繁模式的挖掘问题进行研究.为了解决Naive算法处理该问题时存在冗余运算的问题,提出一种改进的聚簇频繁模式挖掘算法ICFPM(improved cluster frequent pattern mining).该算法使用2种优化策略,一方面可以利用定义的参数minCF,有效减少挖掘结果的搜索空间,另一方面可以参考(n–1)项集的判别结果加速聚簇频繁n项集的判别过程,算法还使用了ICFPM-list结构来减少候选n项集的构建开销.基于两个真实世界数据集的仿真实验证明了ICFPM算法的有效性,与Naive算法相比,ICFPM算法在时间和空间效率方面得到了大幅度的提高,是解决聚簇频繁模式挖掘的有效方法. 展开更多
关键词 时间有序事务数据 聚簇 频繁模式 数据挖掘 向下闭包
在线阅读 下载PDF
一种基数为4的高基数SRT立方根算法设计与实现
2
作者 赵彩虹 刘梓璇 周建涛 《计算机工程与科学》 北大核心 2025年第2期228-237,共10页
SRT立方根算法在多媒体、计算机图形学等领域发挥着重要作用。虽然现有算法可通过增加基数以加快计算速度,但仍存在初始化处理缺乏、商位选择表设计复杂及实现困难的问题。研究设计并实现基数为4的SRT立方根算法。首先,提出一种高基数SR... SRT立方根算法在多媒体、计算机图形学等领域发挥着重要作用。虽然现有算法可通过增加基数以加快计算速度,但仍存在初始化处理缺乏、商位选择表设计复杂及实现困难的问题。研究设计并实现基数为4的SRT立方根算法。首先,提出一种高基数SRT立方根初始化算法,保证后续迭代计算的可执行性;设计基数为4的SRT立方根算法的商位选择表,为商位选择提供必要条件;优化即时转换算法,能够避免转换过程中出现多次进位的情况。其次,基于PyRTL工具改进并实现了上述基数为4的SRT立方根算法,有效缓解了高基数SRT立方根算法困难的问题。最后,与现有基数为2的SRT立方根算法进行对比,以证明该算法的有效性和优越性。 展开更多
关键词 SRT立方根算法 高基数 商位选择表 硬件算法
在线阅读 下载PDF
基于对比学习的大型语言模型反向词典任务提示生成方法 被引量:1
3
作者 田思成 黄少滨 +2 位作者 王锐 李熔盛 杜治娟 《计算机科学》 CSCD 北大核心 2024年第8期256-262,共7页
反向词典任务是一种新兴的任务,目的是根据给定的定义来查找对应的单词。大规模语言模型为这一任务提供了新的可能性,但是提示语句的质量会影响大模型的性能。为此,提出了一种基于对比学习的提示生成方法。该方法在从多个语义层面上理... 反向词典任务是一种新兴的任务,目的是根据给定的定义来查找对应的单词。大规模语言模型为这一任务提供了新的可能性,但是提示语句的质量会影响大模型的性能。为此,提出了一种基于对比学习的提示生成方法。该方法在从多个语义层面上理解定义语义的同时,还利用对比学习的原理在训练过程中引入了负例,提升了模型的泛化能力。通过这种方法,可以将目标单词缩小到一个小范围内,然后用大模型从这个范围内选择最符合定义语义的单词。实验结果表明,该方法可以有效地提升大规模语言模型在反向词典任务上的表现。提示生成模型有94.7%的概率生成包含目标词的范围,大规模语言模型有58.03%的概率直接选出目标单词,有74.55%的概率在给出5个候选单词时包含目标单词。 展开更多
关键词 反向词典 大规模语言模型 对比学习 多个语义层面 对比损失
在线阅读 下载PDF
基于特征再抽象(FRA)的多元时序预测方法 被引量:1
4
作者 王昊 周建涛 +1 位作者 郝昕毓 王飞宇 《计算机科学》 CSCD 北大核心 2023年第S02期650-657,共8页
科技领域的衍生行业因普遍存在强时间约束的特性而累积了海量的高维时间序列数据,严峻的数据压力导致传统的数据建模预测方法受制于数据规模和属性维度。支撑高质量的服务对大数据智能预测技术提出了更高的要求,如何在数据层面上实现预... 科技领域的衍生行业因普遍存在强时间约束的特性而累积了海量的高维时间序列数据,严峻的数据压力导致传统的数据建模预测方法受制于数据规模和属性维度。支撑高质量的服务对大数据智能预测技术提出了更高的要求,如何在数据层面上实现预测性能的提升是现阶段亟待解决的主要问题。针对上述问题,提出了针对多元时序数据的特征再抽象(Feature Re-Abstraction,FRA)算法,首先通过RobustSTL分解算法提取趋势性和季节性特征(Trend and Seasonality Features,TSFs),实现多元数据的特征二阶抽象,以“抽象即特征”替代传统“标签即特征”的提取策略,再通过Pearson相关系数的运算结果评估再抽象技术捕捉的TSFs与目标参数间的相关强度,证实TSF的数据价值。在FRA算法的基础上结合深度学习模型构建基于数据驱动的多元时序预测算法,通过预测效果验证FRA算法的有效性。实验结果表明,引入TSFs作为数据驱动模型的训练向量能够兼具数据降维、降噪及强相关特性地维持,从而避免模型过拟合并缓解模型欠拟合,提高时序预测算法的准确性和鲁棒性。 展开更多
关键词 多元时序数据 多元时序预测算法 特征再抽象 趋势性和季节性特征 相关性评估
在线阅读 下载PDF
基于CEEMDAN-ConvLSTM组合模型的云计算负载预测方法 被引量:4
5
作者 赵鹏 周建涛 赵大明 《计算机科学》 CSCD 北大核心 2023年第S01期642-650,共9页
随着云计算技术的快速发展,越来越多的用户选择使用云服务。负载请求与资源供应的不匹配问题日益凸显,使得用户请求无法得到及时响应,极大地影响云服务质量,实时预测负载请求,将有助于及时供应资源。针对云计算环境中的负载预测方法性... 随着云计算技术的快速发展,越来越多的用户选择使用云服务。负载请求与资源供应的不匹配问题日益凸显,使得用户请求无法得到及时响应,极大地影响云服务质量,实时预测负载请求,将有助于及时供应资源。针对云计算环境中的负载预测方法性能低的问题,提出了一种基于自适应噪声的完备经验模态分解和卷积长时序神经网络组合模型(CEEMDAN-ConvLSTM)的云计算负载预测方法。首先运用自适应噪声的完备经验模态(CEEMDAN)分解技术对数据序列进行分解操作,将其转换为若干个易于分析和建模的子序列;然后运用卷积长时序神经网络(ConvLSTM)预测模型对这一系列子序列进行建模预测,并采用基于多进程并行计算的研究思路,实现多序列并行预测及贝叶斯优化调参;最后将预测值综合叠加以获得整个模型的预测输出,从而实现对原始复杂序列数据进行高精度预测的目标。使用Google集群工作负载数据集进行实验验证,实验结果表明,CEEMDAN-ConvLSTM组合模型具有良好的预测效果,相比自回归差分移动平均模型(ARIMA)、长短期记忆网络(LSTM)和卷积长时序神经网络(ConvLSTM),所提模型预测均方根误差(RMSE)指标分别提升了30.9%,30.1%和22.5%。 展开更多
关键词 云计算 负载预测 卷积长时序神经网络(ConvLSTM) 模态分解技术 贝叶斯优化
在线阅读 下载PDF
DL+:一种增强型双层知识图谱推理框架 被引量:3
6
作者 武月佳 周建涛 《计算机科学》 CSCD 北大核心 2023年第12期302-313,共12页
知识图谱是图数据库的一个重要研究领域,它可以形式化地描述现实世界中的事物及其关系,但其不完整性和稀疏性阻碍了其在诸多领域中的应用。知识图谱推理技术旨在根据知识图谱中已有的知识来推断新的知识或识别错误的知识以完善知识图谱... 知识图谱是图数据库的一个重要研究领域,它可以形式化地描述现实世界中的事物及其关系,但其不完整性和稀疏性阻碍了其在诸多领域中的应用。知识图谱推理技术旨在根据知识图谱中已有的知识来推断新的知识或识别错误的知识以完善知识图谱。尽管现有的各类推理方法可以获得部分有效知识,但仍然存在获取路径不全、忽略局部信息和引入噪声等问题。基于此,发现且明确提出路径连通性差问题并证明推理有效性与实体间路径连通比率呈正相关规律,进一步提出一种用于增强现有推理方法性能的双层框架DL+。模型第一层是知识增广器,主要利用社区发现算法在初始知识图谱上提取实体邻域信息,构建新知识以增广知识规模,然后设计社区剪枝优化去除构建时引入的噪声,最后将增广后的知识图谱抽取还原为与初始图谱表示相同的结构并输出到第二层以保证模型“即插即用”的特性。第二层是知识推理机,通过在知识增广后的图谱上进行学习推理以达到增强现有知识图谱推理模型的目的,使模型可以在图谱路径连通性比率较高的情况下获得更优的推理结果。最终在4个标准知识图谱数据集上进行的大量实验结果表明DL+算法可以有效缓解实体间路径连通性差的问题,与9类基准方法相比,所提算法的预测精度平均提高了4.798%。 展开更多
关键词 知识图谱 知识图谱推理 社区发现 路径连通性 链接预测
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部