-
题名基于RGMM的离散基因表达数据关联规则挖掘
- 1
-
-
作者
黄睿
-
机构
湖南信息职业技术学院计算机系
-
出处
《计算机应用与软件》
CSCD
北大核心
2014年第9期191-193,共3页
-
文摘
由于具有良好的可解释性,关联规则在基于疾病诊断的基因表达数据中表现出优越性,然而,高维基因表达数据中的大量规则阻碍了它的应用。为了缓解这个问题,提出正则化高斯混合模型RGMM(Regularized Gaussian Mixture Model),根据最小描述长度框架,挖掘离散化模型复杂度及信息丢失准则,通过离散化连续的基因表达数据,缓解监督方法中的过拟合现象,并且改善无监督方法中的一些缺点。在六个分类数据集上的大量实验验证了所提方法的有效性。实验结果表明,与其他几种最先进的方法相比,所提的RGMM方法在现实的基因表达数据集中更具实用性。
-
关键词
离散化
基因表达数据
正则化高斯混合模型
关联规则
数据挖掘
-
Keywords
Discretisation
Gene expression data
Regularised Gaussian mixture model
Association rule
Data mining
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
-