海量数据干扰下的危险Web数据挖掘技术研究被引量：6

Huge Amounts of Data Under the Interference of Dangerous Web Data Mining Technology Research

在线阅读下载PDF

导出

摘要提出一种海量数据干扰下基于自组织映射的危险web数据挖掘算法,通过海量数据的预测值与实际值之间的误差对其中的干扰数据进行判断和排除,在此基础上,通过自组织特征映射网络对危险web数据进行挖掘,介绍了自组织特征映射网络及输出层竞争的详细过程,确定一个可形成映射的网络,将待挖掘危险web数据看作是输入向量输入自组织映射网络中,在输出图上产生相应的胜出点,将相似的输入向量汇聚在映射图的相邻区域,与该区域距离较远的胜出点对应的输入向量则可被判断是危险web数据.仿真实验结果表明,采用所提算法对海量数据干扰下的危险web数据进行挖掘,不仅具有很高的挖掘效率,而且在挖掘精度上也有很高的性能. Put forward a lot of data under the dangerous web data mining algorithm based on self-organizing mapping, through massive amounts of data error between the predicted values and the actual value of the judgment and exclude the interference of data, on this basis, through self-organization feature mapping networks for dangerous web data mining, self-organizing feature map network was introduced and the detailed process of the output layer competition, determine a network, can form mapping will be dangerous web data mining as a self- organizing map network input vector input, the output wins produced the corresponding points on the graph, similar input vector convergence in adjacent areas of the map, distance and the region＇s victory points corresponding to the input vector is dangerous web data can be judge. The simulation results show that the proposed algorithm for huge amounts of data under the interference of dangerous web data mining, not only has high efficiency, and also has high performance in mining precision.

作者王曙霞熊曾刚

机构地区湖北工程学院计算机与信息科学学院

出处《微电子学与计算机》 CSCD 北大核心 2016年第2期87-91,共5页 Microelectronics & Computer

关键词海量数据干扰危险web数据挖掘 huge amounts of data interference dangerous web data mining

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

作者简介王曙霞女，（1975-），硕士，副教授．研究方向为智能计算与网络安全．E-mail：wsxwsxxia@163．com 熊曾刚男，（1974-），博士，教授．研究方向为对等计算、网格计算、云计算和信息系统分析与集成．

引文网络
相关文献

参考文献10

1方少卿,周剑,张明新.基于Map／Reduce的改进选择算法在云计算的Web数据挖掘中的研究[J].计算机应用研究,2013,30(2):377-379. 被引量：13
2李悦,高晶,雷鸣.基于云计算技术的Web数据挖掘的算法研究[J].科技资讯,2014,12(18):17-17. 被引量：3
3阮梦黎.基于半结构化分割的Web热点数据挖掘算法[J].科技通报,2015,31(4):115-117. 被引量：3
4刘啸,刘玉龙.基于改进型迭代算法的web数据关联规则挖掘[J].科技导报,2015,33(3):90-94. 被引量：5
5刘奎.基于web数据挖掘的网络课程设计研究[J].赤峰学院学报（自然科学版）,2014,30(21):206-207. 被引量：1
6吴锐,孙银香.云计算平台下的Web数据挖掘研究[J].网络安全技术与应用,2014(8):67-68. 被引量：4
7张鑫.WEB数据挖掘在云计算环境下的研究[J].数字技术与应用,2013,31(3):92-92. 被引量：4
8唐利超.基于Web的数据挖掘技术研究及其应用[J].科技致富向导,2013(30):25-25. 被引量：1
9莫学值,韦必忠.Web数据兴趣区域数据挖掘过程分析[J].科技通报,2013,29(4):202-203. 被引量：3
10刘佳.基于Web服务的数据挖掘系统算法的设计[J].电脑知识与技术,2013,9(5):2951-2954. 被引量：2

二级参考文献53

1孙瑞锋,赵政文.基于云计算的资源调度策略[J].航空计算技术,2010,40(3):103-105. 被引量：43
2罗可,林睦纲,郗东妹.数据挖掘中分类算法综述[J].计算机工程,2005,31(1):3-5. 被引量：63
3黄德才,戚华春.PageRank算法研究[J].计算机工程,2006,32(4):145-146. 被引量：69
4席景科,闫大顺.Web数据挖掘中数据集成问题的研究[J].计算机工程与设计,2006,27(8):1366-1368. 被引量：6
5王鹏.走进云计算[M].北京:人民邮电出版社,2009.
6吴宝贵,丁振国.基于Map/Reduce的分布式搜索引擎研究[J].现代图书情报技术,2007(8):52-55. 被引量：9
7田甜,倪林.基于PageRank算法的权威值不均衡分配问题[J].2007,33(18):53-55.
8Brendan Kitts, David Freed, Martin Vrieze. Cross-sell:A Fast Promotion Tunable Customer-Item Recommenda- tion Method Based on Conditionally Independent Proba- bilities[C]//. In Proceedings of KDD,Based On ACM Press. 2000:437-446.
9Mladenie D.Personal Web Watcher: design and implemen- tation [M]. Department for Intelligent System, J.StefanInstitute.2000.
10Susan Gauch, Jeason Chaffee. Ontology-based personal- ized search and browsing [J]. Web Intelligence and Agent Systems.2003,1 (3);.

共引文献28

1陈卓民.基于HITS算法改进的Web数据挖掘方法研究应用[J].自动化与仪器仪表,2016(7):255-257. 被引量：1
2秦东霞,周航.基于分布式系统的海量数据存储技术[J].周口师范学院学报,2013,30(5):125-128. 被引量：1
3张兴旺,黄晓斌.图书情报学视角下Web挖掘研究述评[J].图书情报工作,2014,58(4):117-126. 被引量：2
4黄伟建,桑志超,杜巍.电子商务环境下的Web数据挖掘系统架构设计[J].河北工程大学学报（自然科学版）,2014,31(2):83-85. 被引量：3
5李悦,高晶,雷鸣.基于云计算技术的Web数据挖掘的算法研究[J].科技资讯,2014,12(18):17-17. 被引量：3
6孙海军.基于云计算的Web数据挖掘的研究[J].智能计算机与应用,2014,4(5):103-104. 被引量：1
7刘猛.一种基于云计算的高效数据挖掘框架研究[J].微型电脑应用,2015,31(6):15-19. 被引量：2
8马增金.云计算及其在数据挖掘上的应用探讨[J].通讯世界,2016,22(1):64-64.
9李俊.基于风险数据挖掘追踪的云计算网络漏洞检测技术[J].科技通报,2016,32(5):107-110. 被引量：9
10吴月红.基于Web的计算机数据挖掘系统设计研究[J].电脑编程技巧与维护,2016(12):74-75. 被引量：4

同被引文献34

1马保国,侯存军,王文丰,钱方正.Web数据挖掘技术及应用[J].计算机与数字工程,2006,34(6):20-22. 被引量：16
2王飞,缑锦.基于多变异粒子群优化算法的模糊关联规则挖掘[J].计算机科学,2013,40(5):217-223. 被引量：12
3赵北松,张争龙,李星毅.一种基于时态约束的加权关联规则挖掘算法[J].福建电脑,2013,29(5):88-90. 被引量：3
4胡立军.数据挖掘技术在程序算法数据库中的应用研究[J].电子技术与软件工程,2014(6):224-224. 被引量：2
5高芹,陈亚.数据挖掘中一种高效的聚类通用框架研究[J].科学技术与工程,2014,22(16):112-118. 被引量：2
6韦侃.Web数据挖掘技术研究与应用[J].计算机光盘软件与应用,2014,17(9):128-129. 被引量：1
7赵蓉英,谭洁,陈晨,董克.基于社会标签共现分析的Web资源聚合流程研究[J].情报理论与实践,2014,37(7):111-115. 被引量：3
8张蓉,钟艳.基于BIRCH算法的模糊集数据库挖掘算法[J].科技通报,2014,30(4):47-49. 被引量：7
9张丽晔,彭健,郑小鹏,赵雯.试验数据统一访问技术研究与实现[J].计算机仿真,2014,31(9):319-322. 被引量：3
10赵雪琴,付媛媛.云计算环境下大规模Web服务故障诊断技术研究[J].计算机测量与控制,2014,22(9):2760-2762. 被引量：3

引证文献6

1伍华丽,任心怡.基于模糊约束的数据库特定数据挖掘算法[J].计算机仿真,2016,33(10):240-243. 被引量：7
2邓左祥,涂芳.一种有效的多关系贝叶斯分类算法[J].微电子学与计算机,2017,34(7):123-127. 被引量：2
3韩红宇,朱丽秋.海量数据干扰下Web数据挖掘技术分析[J].电脑知识与技术,2017,13(7):228-229.
4刘静,王剑,邢胜龙.高校就业信息数据统计智能数据挖掘技术的应用[J].电子技术与软件工程,2017(19):150-150. 被引量：4
5邓有林.大型Web网络数据中心资源高效挖掘技术研究[J].现代电子技术,2018,41(3):120-123. 被引量：5
6代勇.光纤网络中海量冗余干扰信息排除技术研究[J].新一代信息技术,2019,2(17):53-59.

二级引证文献18

1戚龙,赵丹.基于BP神经网络的非特定人语音识别算法[J].科学技术与工程,2017,17(31):277-282. 被引量：13
2石芳.中医临床数据中亚健康信息症状检测仿真[J].计算机仿真,2018,35(2):350-353. 被引量：4
3黄文锋.基于改进神经网络的挖掘算法设计[J].现代电子技术,2018,41(14):143-146. 被引量：5
4李娜.中小型企业数据中心网络的设计[J].系统仿真技术,2018,14(3):164-168.
5金朝.基于Web的网络数字视频监控系统的设计与实现[J].电子设计工程,2018,26(21):170-174. 被引量：7
6陈春回,梁金宏.基于数据挖掘的大学生“非暴力沟通”研究[J].电脑与信息技术,2018,26(6):59-61. 被引量：1
7刘玉娥.基于数据挖掘技术的网络信息过滤系统设计[J].现代电子技术,2018,41(16):51-54. 被引量：7
8张敏.基于神经网络的建筑施工质量评价[J].现代电子技术,2018,41(17):173-177. 被引量：11
9庞金香,隋萌萌.同态加密隐私保护数据高效智能挖掘仿真[J].计算机仿真,2019,36(6):316-319. 被引量：5
10李维虎,张顶山,崔慧明,周龙,朱志挺,谢挺.数据中心网络coflow调度机制结构构建及仿真[J].电子测量技术,2019,42(10):78-81. 被引量：1

1张振宇,黄崇林,谭恒松.基于小波变换的图像识别算法[J].计算机应用,2007,27(B12):97-99. 被引量：6
2方炜炜,谢伟,黄宏博,夏红科.基于隐私保护的序列模式挖掘[J].计算机科学,2016,43(12):195-199. 被引量：4
3彭晓冰,李启顺,王丽珍,朱玉全.面向SVM的隐私保护方法研究进展[J].江苏大学学报（自然科学版）,2017,38(1):78-85. 被引量：3
4陈仿杰.基于自适应压缩感知的信道估计算法[J].无线电通信技术,2014,40(3):39-41.
5胡新平,贺玉芝,倪巍伟,张勇.基于赌轮选择遗传算法的数据隐藏发布方法[J].计算机研究与发展,2012,49(11):2432-2439. 被引量：12
6王晓英.海量冗余数据干扰下数据库中数据优化检索方法[J].华侨大学学报（自然科学版）,2016,37(6):758-761. 被引量：7
7张烨.基于样本关联度权重的增量支持向量机算法[J].电子科技,2017,30(3):41-44. 被引量：5
8孟庆娟,曹青媚,马占飞.海量冗余数据干扰下的网络数据捕获和分析系统研究[J].现代电子技术,2016,39(16):27-30. 被引量：9
9于革,张治国,黄汉滨.利用数据处理算法提高测量仪器精度的探究[J].山东工业技术,2014(6):35-35.
10倪巍伟,徐立臻,崇志宏,吴英杰,刘腾腾,孙志挥.基于邻域属性熵的隐私保护数据干扰方法[J].计算机研究与发展,2009,46(3):498-504. 被引量：16

微电子学与计算机

2016年第2期

浏览历史

内容加载中请稍等...

海量数据干扰下的危险Web数据挖掘技术研究被引量：6

参考文献10

二级参考文献53

共引文献28

同被引文献34

引证文献6

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

海量数据干扰下的危险Web数据挖掘技术研究 被引量：6

参考文献10

二级参考文献53

共引文献28

同被引文献34

引证文献6

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

海量数据干扰下的危险Web数据挖掘技术研究被引量：6