期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
数据流中基于矩阵的频繁项集挖掘 被引量:6
1
作者 王磊 黄志球 +2 位作者 朱小栋 沈国华 程亮 《计算机科学与探索》 CSCD 2008年第3期330-336,共7页
挖掘频繁项集是挖掘数据流的基本任务。许多近似算法能够有效地对数据流进行频繁项挖掘,但不能有效地控制内存资源消耗和挖掘运行时间。为了提高数据流频繁项集挖掘的时空效率,通过引入矩阵作为概要数据结构,提出了一种新的数据流频繁... 挖掘频繁项集是挖掘数据流的基本任务。许多近似算法能够有效地对数据流进行频繁项挖掘,但不能有效地控制内存资源消耗和挖掘运行时间。为了提高数据流频繁项集挖掘的时空效率,通过引入矩阵作为概要数据结构,提出了一种新的数据流频繁项集挖掘算法。最后通过实验证明了该算法的有效性。 展开更多
关键词 数据流 数据挖掘 频繁模式 矩阵
在线阅读 下载PDF
数据流中结构二叉树挖掘算法研究 被引量:2
2
作者 唐向红 元宁 +1 位作者 易向华 陆见光 《计算机应用研究》 CSCD 北大核心 2017年第10期2924-2928,共5页
针对传统数据流挖掘算法不能挖掘出频繁项之间的关系而且挖掘时间和空间复杂度高、准确度不高的问题,提出了一种数据流中结构二叉树挖掘算法(AMST)。该算法利用了二叉树结构的优势,将所处理事务数据库中的数据流转换成结构化二叉树,然... 针对传统数据流挖掘算法不能挖掘出频繁项之间的关系而且挖掘时间和空间复杂度高、准确度不高的问题,提出了一种数据流中结构二叉树挖掘算法(AMST)。该算法利用了二叉树结构的优势,将所处理事务数据库中的数据流转换成结构化二叉树,然后利用数据流矩阵对结构二叉树进行挖掘。整个过程只对事务数据库进行一次扫描,大大提高了挖掘的效率;此外,算法还找出了具有层次关系的频繁子树。实验结果表明,AMST算法性能稳定,在时间复杂度和空间复杂度方面有很大的优越性,能够快速准确地对数据流进行挖掘。 展开更多
关键词 数据流 频繁项集 结构二叉树 数据流矩阵
在线阅读 下载PDF
基于矩阵的数据流Top-k频繁项集挖掘算法 被引量:3
3
作者 尹绍宏 范桂丹 《计算机工程》 CAS CSCD 2014年第3期55-58,75,共5页
传统的数据挖掘算法在挖掘频繁项集时会产生大量的冗余项集,影响挖掘效率。为此,提出一种基于矩阵的数据流Top-k频繁项集挖掘算法。引入2个0-1矩阵,即事务矩阵和二项集矩阵。采用事务矩阵表示滑动窗口模型中的事务列表,通过计算每行的... 传统的数据挖掘算法在挖掘频繁项集时会产生大量的冗余项集,影响挖掘效率。为此,提出一种基于矩阵的数据流Top-k频繁项集挖掘算法。引入2个0-1矩阵,即事务矩阵和二项集矩阵。采用事务矩阵表示滑动窗口模型中的事务列表,通过计算每行的支持度得到二项集矩阵。利用二项集矩阵得到候选项集,将事务矩阵中对应的行做逻辑与运算,计算出候选项集的支持度,从而得到Top-k频繁项集。把挖掘的结果存入数据字典中,当用户查询时,能够按支持度降序输出Top-k频繁项集。实验结果表明,该算法在挖掘过程中能避免冗余项集的产生,在保证正确率的前提下具有较高的时间效率。 展开更多
关键词 数据挖掘 数据流 滑动窗口 矩阵 Top-k频繁项集
在线阅读 下载PDF
滑动窗口中数据流频繁项集挖掘方法 被引量:8
4
作者 张月琴 《计算机工程与应用》 CSCD 北大核心 2010年第16期132-134,共3页
根据数据流的流动性与连续性,提出了一种滑动窗口中频繁项集挖掘算法NSW,满足了人们快速获取最近到达数据中频繁项集的需求。该算法采用二进制矩阵表示滑动窗口中的事务列表,通过直接删除最老事务、不产生候选项集等方法控制时间和空间... 根据数据流的流动性与连续性,提出了一种滑动窗口中频繁项集挖掘算法NSW,满足了人们快速获取最近到达数据中频繁项集的需求。该算法采用二进制矩阵表示滑动窗口中的事务列表,通过直接删除最老事务、不产生候选项集等方法控制时间和空间的开销。实验表明,该算法具有较好的时间和空间效率。 展开更多
关键词 数据挖掘 数据流 频繁项集 滑动窗口 矩阵
在线阅读 下载PDF
滑动窗口中数据流最大频繁项集挖掘算法研究 被引量:7
5
作者 尹绍宏 单坤玉 范桂丹 《计算机工程与应用》 CSCD 北大核心 2015年第22期145-149,共5页
数据流最大频繁项集的项集数目相对很少并且已隐含所有的频繁项集,所以数据流中最大频繁项集的挖掘具有很好的时空效率并且有很大的意义,也受到了业界更多的关注。针对数据流最大频繁项集的挖掘,提出了在滑动窗口中基于矩阵的数据流最... 数据流最大频繁项集的项集数目相对很少并且已隐含所有的频繁项集,所以数据流中最大频繁项集的挖掘具有很好的时空效率并且有很大的意义,也受到了业界更多的关注。针对数据流最大频繁项集的挖掘,提出了在滑动窗口中基于矩阵的数据流最大频繁项集挖掘方法 SWM-MFI,主要采用两个矩阵来存储数据信息:一个矩阵是事务矩阵,存储事务数据;一个矩阵是二项集矩阵,存放频繁2-项集。通过二项集矩阵扩展得到频繁k-项集,基于SWM-MFI算法挖掘出最大频繁项集。经过理论和实验证明该算法具有很好的时效性。 展开更多
关键词 数据流 滑动窗口 最大频繁项集 矩阵
在线阅读 下载PDF
数据流最大频繁项挖掘方法 被引量:2
6
作者 张月琴 陈东 《计算机工程》 CAS CSCD 北大核心 2010年第22期86-87,90,共3页
提出基于事务矩阵挖掘最大频繁项集的方法AFMI,该方法采取迭代精简事务矩阵的方式求解所有事务中的最大频繁项集,从精简后的事务向量交集的子集中搜索最大频繁项集,并运用逻辑运算和剪枝方法提高挖掘效率。基于AFMI方法,研究挖掘滑动窗... 提出基于事务矩阵挖掘最大频繁项集的方法AFMI,该方法采取迭代精简事务矩阵的方式求解所有事务中的最大频繁项集,从精简后的事务向量交集的子集中搜索最大频繁项集,并运用逻辑运算和剪枝方法提高挖掘效率。基于AFMI方法,研究挖掘滑动窗口数据流最大频繁项集算法AFMI+,该算法可使用户周期性地挖掘当前窗口中的最大频繁项集。实验结果表明,AFMI和AFMI+算法均具有较好的性能。 展开更多
关键词 数据挖掘 数据流 滑动窗口 最大频繁项集 矩阵
在线阅读 下载PDF
一种GPU及深度置信网络的语音识别加速算法研究 被引量:1
7
作者 景维鹏 姜涛 +1 位作者 朱良宽 刘美玲 《小型微型计算机系统》 CSCD 北大核心 2018年第3期551-555,共5页
为解决语音识别中深度置信网络(DBN)参数过多,GPU无法一次性存储全部参数和现有DBN的GPU实现效率过低问题,提出一种基于GPU的DBN优化算法(op CD-k).利用Kaldi语音识别工具提取语音数据的f MLLR特征,将DBN模型的权重矩阵进行合理划分,充... 为解决语音识别中深度置信网络(DBN)参数过多,GPU无法一次性存储全部参数和现有DBN的GPU实现效率过低问题,提出一种基于GPU的DBN优化算法(op CD-k).利用Kaldi语音识别工具提取语音数据的f MLLR特征,将DBN模型的权重矩阵进行合理划分,充分利用GPU的共享内存,并采用GPU的流处理模式;为解决多GPU中基于数据并行的参数交换成为制约DBN性能提高的问题,使用参数服务器模式,并在多GPU中使用op CD-k算法.实验结果证明:op CD-k算法在保证语音识别正确率的前提下,可以显著提升DBN模型的训练速度. 展开更多
关键词 深度置信网络 权重矩阵 流处理 数据并行 参数服务器 多GPU
在线阅读 下载PDF
基于特征选择的数据流聚类
8
作者 龙鹏飞 唐军 王琳 《计算机工程与设计》 CSCD 北大核心 2010年第19期4235-4237,4241,共4页
在数据流聚类时,冗余特征会影响数据的聚类质量,移除冗余特征以提高聚类质量就显得尤为重要。为解决此问题,提出一种基于特征选择的数据流聚类算法(DSCFC)。该算法应用了特征排序、特征等级评定、探测冗余不重要的特征、移除冗余特征算... 在数据流聚类时,冗余特征会影响数据的聚类质量,移除冗余特征以提高聚类质量就显得尤为重要。为解决此问题,提出一种基于特征选择的数据流聚类算法(DSCFC)。该算法应用了特征排序、特征等级评定、探测冗余不重要的特征、移除冗余特征算法等。实验结果表明,DSCFC算法能探测出数据流中隐含的冗余特征并移除冗余特征,在对有冗余特征的数据流聚类时,比CluSteam算法更有效,聚类质量更好。 展开更多
关键词 数据流聚类 特征选择 冗余特征 代价矩阵 特征移除
在线阅读 下载PDF
矿山遥感监测指标快速统计方法研究与实现 被引量:3
9
作者 刘晰 郝利娜 +3 位作者 杨显华 黄洁 张志 杨武年 《国土资源遥感》 CSCD 北大核心 2020年第2期259-265,共7页
全国矿山开发状况和矿山遥感环境监测实施中,监测数据指标的统计计算是监测成果集中展现和应用的主要方法之一,是相关部分执法的依据,同时也为相关矿山政策调整和制定提供数据支撑。传统人工统计计算各项监测指标存在效率低下、人工成... 全国矿山开发状况和矿山遥感环境监测实施中,监测数据指标的统计计算是监测成果集中展现和应用的主要方法之一,是相关部分执法的依据,同时也为相关矿山政策调整和制定提供数据支撑。传统人工统计计算各项监测指标存在效率低下、人工成本高、工作量大、计算易出错、准确度低、统计标准不一致等问题。通过项目实践提出基于数据流式过滤和多维矩阵计算的矿山遥感监测自动统计方法,快速统计各矿山遥感监测数据的属性信息和空间信息,分别实现按照行政区域和矿山类型统计计算各个分类指标,完成矿山统计指标的快速汇总。实验结果表明,该方法在2018年青海省矿山遥感监测项目中,快速、准确、自动化地完成了统计汇总,节省了大量人力资源和时间,具有较好的应用效果。 展开更多
关键词 矿山遥感监测 数据流式过滤 多维矩阵计算 自动统计 统计指标
在线阅读 下载PDF
一种基于用户兴趣转移挖掘的流式推荐算法 被引量:1
10
作者 陈建宗 刘永坚 +1 位作者 解庆 唐伶俐 《计算机应用与软件》 北大核心 2020年第1期59-65,共7页
推荐系统是当下解决信息超载的有效方法,但由于用户兴趣转移现象的存在,传统推荐系统在时间跨度较长的应用场景下表现并不理想。为了解决该问题,提出一种基于用户兴趣转移挖掘的流式推荐算法。根据资源的种类信息构建资源特征向量,采取... 推荐系统是当下解决信息超载的有效方法,但由于用户兴趣转移现象的存在,传统推荐系统在时间跨度较长的应用场景下表现并不理想。为了解决该问题,提出一种基于用户兴趣转移挖掘的流式推荐算法。根据资源的种类信息构建资源特征向量,采取增量更新方法,根据流数据实时更新模型参数,避免了传统增量矩阵分解模型中的拟合残差扩大问题。模型结合提出的两种新型遗忘机制,能够有效区分用户历史数据中的临时偏好与长期偏好,从而在遗忘用户过时数据的同时,保留用户的长期偏好。在电影推荐数据集中进行实验,证明了该算法的有效性。 展开更多
关键词 推荐系统 兴趣转移 流数据挖掘 增量矩阵分解
在线阅读 下载PDF
差分隐私流数据实时发布方法 被引量:1
11
作者 葛晨 吴英杰 孙岚 《计算机科学与探索》 CSCD 北大核心 2018年第11期1748-1757,共10页
许多流数据相关的实际应用需要进行大量的实时查询,现有的解决方案无法满足大量实时查询的效率要求。为此,提出一种差分隐私流数据实时发布方法。首先利用树状数组构建滑动窗口内流数据对应的统计发布模型,可在线性时间内实现滑动窗口... 许多流数据相关的实际应用需要进行大量的实时查询,现有的解决方案无法满足大量实时查询的效率要求。为此,提出一种差分隐私流数据实时发布方法。首先利用树状数组构建滑动窗口内流数据对应的统计发布模型,可在线性时间内实现滑动窗口下的连续统计发布,随后通过连续统计发布结果的线性组合即可在O(1)时间内获得用户需要的任意区间查询结果;其次,利用矩阵在处理关联性查询方面的优势,在查询效率量级不变的前提下利用对角矩阵优化进一步提高查询精度。实验对所提算法的查询效率和查询精度与同类算法进行比较分析,实验结果表明,该方法可显著提升查询效率并具有较优的查询精度。 展开更多
关键词 差分隐私 流数据发布 查询效率 矩阵机制
在线阅读 下载PDF
基于上下文与马尔科夫矩阵分解的流式推荐算法 被引量:3
12
作者 纪淑娟 申彦博 王振 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第3期104-111,共8页
为了验证用户对项目评分时所处的上下文环境是否会对用户的偏好产生影响,基于矩阵过程的马尔科夫分解方法,提出了一种基于上下文的流式推荐算法(streaming recommendation algorithm based on context,C-SRA),该方法可以从嘈杂的上下文... 为了验证用户对项目评分时所处的上下文环境是否会对用户的偏好产生影响,基于矩阵过程的马尔科夫分解方法,提出了一种基于上下文的流式推荐算法(streaming recommendation algorithm based on context,C-SRA),该方法可以从嘈杂的上下文中有效选取与评分相关的上下文信息,并将选取的上下文信息分为主观上下文和客观上下文两类。基于LDOS-CoMoDa数据集的两组对比实验显示,C-SRA算法无论是评分预测性能还是推荐性能均优于其他对比算法。 展开更多
关键词 流式数据 上下文 矩阵分解 信息增益 流式推荐算法
在线阅读 下载PDF
基于信息熵降维的混合属性数据流聚类算法
13
作者 谭建建 郑洪源 丁秋林 《计算机工程》 CAS CSCD 北大核心 2011年第19期82-84,87,共4页
现有的数据流聚类算法无法处理高维混合属性的数据流。针对该问题,对HPStream算法的脱机聚类和联机聚类过程进行改进,利用频度矩阵处理名词属性,通过基于信息熵的名词属性选择方法降低数据维度。实验结果表明,该算法能有效处理混合属性... 现有的数据流聚类算法无法处理高维混合属性的数据流。针对该问题,对HPStream算法的脱机聚类和联机聚类过程进行改进,利用频度矩阵处理名词属性,通过基于信息熵的名词属性选择方法降低数据维度。实验结果表明,该算法能有效处理混合属性和维度较高的数据集,与HPStream算法相比,聚类精度有5%~15%的提高。 展开更多
关键词 数据流挖掘 混合属性 频度矩阵 信息熵 降维
在线阅读 下载PDF
成分数据典型相关分析的增量算法
14
作者 孔博傲 卢珊 王惠文 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2023年第10期2851-2858,共8页
成分数据典型相关分析(CCAI)是一种研究多个成分数据变量之间线性相关关系的方法,在经济、管理、地质、化学等多个领域应用广泛。在海量数据背景下,研究如何针对成分数据流展开典型相关建模分析,具有重要的理论意义和实用价值。为此,提... 成分数据典型相关分析(CCAI)是一种研究多个成分数据变量之间线性相关关系的方法,在经济、管理、地质、化学等多个领域应用广泛。在海量数据背景下,研究如何针对成分数据流展开典型相关建模分析,具有重要的理论意义和实用价值。为此,提出了成分数据典型相关分析的增量方法,通过对增量成分数据的协方差分解,实现对成分数据流典型相关性的精确计算。同时,给出序贯式和并行式2种分块增量算法,可处理多组成分数据的数据流建模问题,序贯式分块增量算法,按照数据流的先后顺序进行计算,并行式分块增量算法可以达到提高计算效率的目的。通过对不同概率分布和样本规模的成分数据流的仿真研究及微博假新闻的实例分析,验证了所提算法相比于传统的非增量算法,在保证计算准确性的前提下,具有提高运算效率的优势。 展开更多
关键词 成分数据 典型相关分析 数据流 协方差矩阵 特征分解
在线阅读 下载PDF
针对混合STBC结构的分组检测算法
15
作者 陈子慧 杨晨阳 《信号处理》 CSCD 北大核心 2008年第5期785-789,共5页
本文针对混合STBC MIMO系统,利用Alamouti矩阵结构的特点给出了一系列基于分块逆矩阵的低复杂度检测算法,并且通过仿真进行了性能分析。结果表明,该检测算法与前人给出的常规检测算法的性能一致,但其采用分块逆矩阵递归检测的方法利用Al... 本文针对混合STBC MIMO系统,利用Alamouti矩阵结构的特点给出了一系列基于分块逆矩阵的低复杂度检测算法,并且通过仿真进行了性能分析。结果表明,该检测算法与前人给出的常规检测算法的性能一致,但其采用分块逆矩阵递归检测的方法利用Alamouti矩阵的特点大大降低了解码的复杂度。 展开更多
关键词 MIMO STBC V-BLAST 分组检测 分块逆矩阵 数据流分离
在线阅读 下载PDF
基于多维协方差矩阵和PMU动态数据的网络状态估计算法 被引量:1
16
作者 杨召 徐姣新 《计算机应用与软件》 北大核心 2022年第9期167-173,共7页
将海量PMU数据表示为大的随机矩阵流,利用大规模PMU数据协方差矩阵的变化,提出一种基于多维协方差矩阵测试的功率状态估计算法。假设PMU数据没有特殊的参数分布或维数结构,所提出的检验统计量是可预测的。通过主成分分析和冗余计算将预... 将海量PMU数据表示为大的随机矩阵流,利用大规模PMU数据协方差矩阵的变化,提出一种基于多维协方差矩阵测试的功率状态估计算法。假设PMU数据没有特殊的参数分布或维数结构,所提出的检验统计量是可预测的。通过主成分分析和冗余计算将预测统计量复杂度从O(εn_(g)^(4))简化为O(ηn_(g)^(2))。利用IEEE 30、IEEE 118节点系统、波兰2383节点系统和实际的34 PMU系统对该算法进行了估计。算例分析证明了所提出的状态估计指标的优越性。 展开更多
关键词 状态估计 海量流式PMU数据 多维协方差矩阵测试 效率计算 智能电网
在线阅读 下载PDF
基于迁移学习的并行化大数据流传输系统设计 被引量:4
17
作者 庞崇高 陆玉发 《现代电子技术》 北大核心 2020年第18期40-42,46,共4页
传统系统在并行化大数据流组件不变情况下的吞吐量会随着并发数增多而减少,影响数据流传输效率。为了解决这一问题,提出基于迁移学习的并行化大数据流传输系统。系统硬件由FPGA核心控制器、XC7K325T-2FFG 900芯片、DCM时钟组成,用于实... 传统系统在并行化大数据流组件不变情况下的吞吐量会随着并发数增多而减少,影响数据流传输效率。为了解决这一问题,提出基于迁移学习的并行化大数据流传输系统。系统硬件由FPGA核心控制器、XC7K325T-2FFG 900芯片、DCM时钟组成,用于实时传输数据流。系统软件是在STORM平台上引入迁移学习算法。软、硬件结合,完成基于迁移学习的并行化大数据流传输系统设计。实验分别测试了两个系统在并行化大数据流组件不变情况下的吞吐量。将并行化大数据流分类组件设置为(5.5),(5.6),(5.7),(5.8),从实验结果可知,所设计的系统吞吐量会随着并发数、线程增多,呈上升趋势,能够有效提升并行化大数据流传输效率。 展开更多
关键词 并行化大数据流 数据流传输 系统设计 迁移学习算法 吞吐量测试 数据矩阵
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部