期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于过采样技术和随机森林的不平衡微阵列数据分类方法研究 被引量:9
1
作者 于化龙 高尚 +1 位作者 赵靖 秦斌 《计算机科学》 CSCD 北大核心 2012年第5期190-194,共5页
近年来,应用DNA微阵列技术对疾病,尤其是癌症进行诊断,已逐渐成为生物信息学领域的研究热点之一。对比其它的数据载体,微阵列数据通常具有一些独有的特点。针对微阵列数据样本分布不平衡这一特点,提出了一种基于概率分布的过采样技术,... 近年来,应用DNA微阵列技术对疾病,尤其是癌症进行诊断,已逐渐成为生物信息学领域的研究热点之一。对比其它的数据载体,微阵列数据通常具有一些独有的特点。针对微阵列数据样本分布不平衡这一特点,提出了一种基于概率分布的过采样技术,通过该技术可以为少数类建立一些合理的伪样本,从而使各类的样本数达到均衡,然后使用随机森林分类器对其进行分类。该方法的有效性和可行性已经在两个标准的微阵列数据集上得到了验证。实验结果显示,与传统的方法相比,该方法可以获得更好的分类性能。 展开更多
关键词 微阵列数据 样本分布不平衡 过采样技术 概率分布 随机森林
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部