期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
一种流数据立方体分析挖掘框架 被引量:2
1
作者 金苍宏 刘泽民 +1 位作者 吴明晖 应晶 《电信科学》 北大核心 2014年第9期61-71,共11页
流数据是目前一种重要的数据展现形式,对流数据进行OLAM(联机分析挖掘)操作可为分析人员提供多层次的数据视图。但OLAM要求在不同粒度中实现对数据的聚合操作,而流式数据内含时态特性和持续到达特性,使得数据无法被多次重复操作。使用传... 流数据是目前一种重要的数据展现形式,对流数据进行OLAM(联机分析挖掘)操作可为分析人员提供多层次的数据视图。但OLAM要求在不同粒度中实现对数据的聚合操作,而流式数据内含时态特性和持续到达特性,使得数据无法被多次重复操作。使用传统OLAP(联机分析处理)方法无法生成部分物化视图且流数据规模宏大,受限于存储空间大小而无法保存全部数据单元信息。针对上述问题,提出了一种基于概要技术的流数据OLAM框架——sketch cube(概要立方体),该框架把任意维度组合映射成唯一自然数,根据上下限单调原则对维度组合裁剪,在类线性空间中保存有效数据单元信息,并构建时间序列索引提高检索效率。通过理论分析给出使用sketch cube的前提条件,同时通过真实海量流数据实验分析表明,sketch sube在有效性、存储空间效率和正确率上可以满足实时挖掘的需求。 展开更多
关键词 流数据 概要立方体 联机分析挖掘 实时分析
在线阅读 下载PDF
一种基于上下文索引的文本匹配框架 被引量:1
2
作者 金苍宏 吴明晖 应晶 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2013年第9期1537-1546,共10页
为了提高信息挖掘方法的效率和动态性,支持在线定义知识提取模式,提出一种快速文本匹配框架.该框架包括上下文索引、上下文挖掘语言、上下文匹配算法等模块.框架从索引中直接获得提取内容的上下文信息,无需依赖文本过滤,从而提高信息提... 为了提高信息挖掘方法的效率和动态性,支持在线定义知识提取模式,提出一种快速文本匹配框架.该框架包括上下文索引、上下文挖掘语言、上下文匹配算法等模块.框架从索引中直接获得提取内容的上下文信息,无需依赖文本过滤,从而提高信息提取性能.理论分析和实验表明:本框架提取方法同文本提取方法、倒排提取方法等相比,其运行时间在不同大小和结构的数据集上更为稳定高效,提取模式的长度对本框架的影响较小,因此,适合海量数据的在线提取. 展开更多
关键词 上下文索引 上下文挖掘语言 文本提取 提取框架
在线阅读 下载PDF
融合序列分解与时空卷积的时序预测算法 被引量:8
3
作者 金苍宏 董腾然 +3 位作者 陈天翼 吴明晖 李国军 周胜利 《电子学报》 EI CAS CSCD 北大核心 2021年第2期233-238,共6页
现有深度学习方法在对时间序列预测时,未充分考虑空间依赖性,且长期预测的准确率也较低.针对此问题,提出一种融合时间序列分解策略和时空卷积神经网络的时序预测模型SDBRNN(Series-Decomposition-Block Recurrent Neural Network).该模... 现有深度学习方法在对时间序列预测时,未充分考虑空间依赖性,且长期预测的准确率也较低.针对此问题,提出一种融合时间序列分解策略和时空卷积神经网络的时序预测模型SDBRNN(Series-Decomposition-Block Recurrent Neural Network).该模型首先学习序列的多周期值并对序列进行最优STL分解;然后结合相邻观察点构造兼具时空数据块;再采用Block-LSTM中的三维卷积模块对时空数据块进行特征提取,让三维块在LSTM细胞中参与状态更新和反向传播,最终实现模型对时空特征的学习.结合多个时空序列测试数据分析,表明该模型在具有空间依赖关系的时序数据集上,比传统的时间卷积模型和循环神经网络具有更好的时空特征提取能力和拟合预测能力,验证了该模型的有效性. 展开更多
关键词 时间序列预测 序列分解 时空卷积
在线阅读 下载PDF
基于评分卡——随机森林的云计算用户公共安全信誉模型研究 被引量:2
4
作者 周胜利 金苍宏 +1 位作者 吴礼发 洪征 《通信学报》 EI CSCD 北大核心 2018年第5期143-152,共10页
传统云计算用户信誉的研究主要集中在对用户操作行为信誉评估,较少涉及用户发布文本信息的安全管理,并且存在指标筛选欠准确、信誉评估结果缺乏科学验证等问题,难以满足监管部门的实际需求。针对以上问题,提出基于评分卡—随机森林的云... 传统云计算用户信誉的研究主要集中在对用户操作行为信誉评估,较少涉及用户发布文本信息的安全管理,并且存在指标筛选欠准确、信誉评估结果缺乏科学验证等问题,难以满足监管部门的实际需求。针对以上问题,提出基于评分卡—随机森林的云计算用户公共安全信誉模型。首先,利用Word2Vec和卷积神经网络进行公共安全标签分类;其次,采用评分卡方法,筛选强相关性指标;最后,结合随机森林算法,建立云计算用户公共安全信誉模型。实验分析表明,所建立的模型能够解决云计算公共安全监管中用户信誉指标筛选不准确和信誉区分准确性低等问题,能够有效识别有害用户,提高云计算用户监管效率。 展开更多
关键词 云计算安全 安全监管 评分卡 随机森林 卷积神经网络
在线阅读 下载PDF
基于意图识别的不确定性行为序列预测方法
5
作者 何飞 金苍宏 吴明晖 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2022年第2期254-262,共9页
针对协同推荐和序列表征方法在预测用户行为任务上面临的行为不确定性和数据稀疏问题,提出基于意图识别的不确定性行为序列预测(G2IE)方法. G2IE方法根据计划行为理论(TPB),对用户行为序列中受控行为模式进行挖掘;基于信息熵计算相邻受... 针对协同推荐和序列表征方法在预测用户行为任务上面临的行为不确定性和数据稀疏问题,提出基于意图识别的不确定性行为序列预测(G2IE)方法. G2IE方法根据计划行为理论(TPB),对用户行为序列中受控行为模式进行挖掘;基于信息熵计算相邻受控行为之间的不确定性行为列表的行为转移意图强度;融合行为转移意图增强行为关系,弥补行为意图缺失. G2IE方法挖掘行为的不确定性关系,并用模型进行量化,用于解决行为不确定性难点;通过融合转移意图方法能够发现更多的行为关系,也在一定程度上缓解数据稀疏的问题.较其他使用行为直接关系的方法,G2IE方法有更准确丰富的表示能力.在3个公开行为数据集上进行对比实验,结果表明,本研究方法在综合指标F1值上均为最优,证明了所提方法的有效性. 展开更多
关键词 行为模式挖掘 不确定性关系 意图识别 图嵌入 行为序列预测
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部