-
题名基于改进混沌分区算法的模糊信息抽取
被引量:7
- 1
-
-
作者
万福成
-
机构
中国民族语言文字信息技术教育部重点实验室
西北民族大学
-
出处
《计算机应用研究》
CSCD
北大核心
2019年第10期2952-2954,2970,共4页
-
基金
国家自然科学基金资助项目(61762076)
-
文摘
在大数据环境下进行模糊信息挖掘抽取中受到数据之间的小扰动类间干扰的影响,导致信息抽取的特征聚类性不好。为此提出一种基于改进混沌分区算法的模糊信息抽取方法,对高维数据信息流进行分布式结构重组,以Lorenz混沌吸引子作为训练测试集进行大数据模糊信息抽取的自适应学习训练,采用相空间重构技术对大数据的混沌吸引子负载特征量进行自相关特征匹配处理,提取模糊信息的平均互信息特征量,结合关联规则模糊配对方法进行大数据混沌分区,实现模糊信息的优化聚类,根据数据聚类结果实现模糊信息准确抽取,对抽取的高维模糊信息进行特征压缩,降低计算开销。仿真结果表明,采用该方法进行大数据样本序列的模糊信息抽取的聚类性较好,抗类间扰动能力较强,模糊信息抽取的准确概率较高,在数据挖掘和特征提取中具有很好的应用价值。
-
关键词
大数据
混沌
分区算法
聚类
模糊信息抽取
-
Keywords
large data
chaos
partition algorithm
clustering
fuzzy information extraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名中文文本的信息自动抽取和相似检索机制
被引量:3
- 2
-
-
作者
林鸿飞
杨志豪
赵晶
-
机构
大连理工大学计算机系
-
出处
《小型微型计算机系统》
CSCD
北大核心
2007年第11期2074-2079,共6页
-
基金
国家自然科学基金项目(6037309560673039)资助.
-
文摘
目前信息抽取成为提供高质量信息服务的重要手段,提出面向中文文本信息的自动抽取和相似检索机制,其基本思想是将用户兴趣表示为语义模板,对关键字进行概念扩充,通过搜索引擎获得初步的候选文本集合,在概念触发机制和部分分析技术基础上,利用语义关系到模板槽的映射机制,填充文本语义模板,形成结构化文本数据库.基于文本数据表述的模糊性,给出用户查询与文本语义模板的相似关系,实现了相似检索,可以更加全面地满足用户的信息需求.
-
关键词
信息抽取语义模板概念扩充模糊语义
-
Keywords
information extraction
semantic templates
conceptual expansion
fuzzy semantic
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-