期刊文献+

大数据环境下文本信息挖掘系统设计 被引量:22

Design of text information mining system in big data environment
在线阅读 下载PDF
导出
摘要 传统文本信息挖掘技术系统能够对文本信息进行系统的信息挖掘,但是在大数据环境下容易产生系统的数据识别乱码以及数据干扰。针对上述问题,提出一种大数据环境下文本信息挖掘系统设计方案,在系统的硬件设备上增加数据简化器,通过数据简化器能够对数据进行一定的过滤筛选,保证数据进入识别阶段的准确率,同时促进了数据挖掘过程的效率,对文本信息挖掘的过程使用质数矩阵模型,通过建立的质数矩阵模型能够有效地对文本信息进行深层次的挖掘。同时优化了Aprioirt计算方法,保证了对文本信息的优先识别度,避免了传统方法中出现的数据混乱以及数据干扰问题。为了验证设计的大数据环境下文本信息挖掘系统的有效性,设计了对比仿真实验,通过实验数据的分析,有效地证明了设计的大数据环境下文本信息挖掘系统的有效性,避免了传统方法中出现的数据混乱以及数据干扰问题。 The traditional text information mining technology system can carry out the systematic information mining for text information, but is easy to generate the data identification messy code of the system and data interference in the big data environment. Aiming at these problems, a design scheme of text information mining system in big data environment is put forward. The data reducer is added on the hardware device of the system, which can filter the data, ensure the accuracy of data entered into the recognition stage, and improve the efficiency of data mining. The prime number matrix model is used in the process of information mining to mine the text information deeply. The Aprioirt computing method is optimized to ensure the priority recognition of text information, avoid the data chaos and data interference of the traditional method. In order to verify the effectiveness of text information mining system in large data environment, the contrast simulation experiment was designed. The experimental data verifies that the text information mining system in large data environment is effective, and can avoid the data chaos and data interference of the traditional methods.
出处 《现代电子技术》 北大核心 2018年第1期125-128,共4页 Modern Electronics Technique
基金 廊坊市科技局项目:一种改进的C4.5算法在构造客户分类决策树中的应用(2016011090) 北华航天工业学院校级项目:数据挖掘在高校学生成绩管理中的应用(KY-2016-19)~~
关键词 大数据环境 文本信息 关联密度 Aprioirt计算方法 挖掘系统 big data environment text information correlation density Aprioirt computing method mining system
作者简介 赵逸智(1982-),男,山西平遥人,硕士,助理研究员。研究方向为计算机技术、成人教育。;张云峰(1982-),男,河北正定人,硕士,讲师。研究方向为数据库、数据挖掘、大数据。
  • 相关文献

参考文献10

二级参考文献120

共引文献115

同被引文献260

引证文献22

二级引证文献116

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部