-
题名关联文本分类的规则修正策略
被引量:6
- 1
-
-
作者
邱江涛
唐常杰
曾涛
刘胤田
-
机构
西南财经大学中国支付体系研究中心
四川大学计算机学院
天津师范大学计算机与信息工程学院
成都信息工程学院智能信息处理实验室
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2009年第4期683-688,共6页
-
基金
"十一五"国家科技支撑计划基金项目(2006BAI05A01)
国家自然科学基金项目(60773169)~~
-
文摘
通过分析基于关联规则的文本分类,发现在保持分类规则对正例样本正确分类的同时减少对反例样本的错误分类可以提高分类的精确度.基于否定选择算法的思想提出了分类规则修正策略,用反例样本集合对分类规则进行耐受,从分类规则错误判别的反例样本中再产生规则,与原来的规则组成新规则,称为增强关联规则.基于修正策略产生的增强关联规则可以大幅度地减少对反例样本的错误分类,从而提高分类的精确度.通过形式化证明和实验,分类规则修正策略的有效性得到验证.
-
关键词
关联规则
增强关联规则
文本分类
否定选择算法
规则修正
-
Keywords
association rule
enhanced association rule
text classification
negative selection algorithm
rule revising
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名最大亚频繁模式挖掘算法研究
被引量:1
- 2
-
-
作者
张海清
刘胤田
-
机构
成都信息工程学院智能信息处理实验室
四川大学数学学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第14期62-64,共3页
-
基金
国家自然科学基金资助项目(60773169
60702075)
-
文摘
为解决传统最大频繁模式在项集频繁度与项集长度规模之间的制约关系,提出最大亚频繁模式概念及其挖掘算法MSFP-mining,包括最大亚频繁模式概念并分析其要素特点,基于AFP-tree、CMP-tree、SFP-tree、SFP-growth的候选MSFP挖掘方法,基于MSFP-tree的最大亚频繁模式超集检测和剪枝策略及对MSFP-mining挖掘性能的实验验证。实验结果表明,该算法利用差别频繁度实现核心项集、附加频繁项集、补充频繁项集的阶段性求取和组合,在保证项集频繁度基础上实现最大亚频繁模式挖掘,扩展频繁模式规模。
-
关键词
模式挖掘
最大亚频繁模式
数据集
超集检测
MSFP-tree结构
-
Keywords
pattern mining
Maximal Sub-Frequent Pattern(MSFP)
data set
superset check
MSFP-tree structure
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-