期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
一种基于二次互信息的双聚类算法 被引量:4
1
作者 闫雷鸣 孙志挥 《计算机工程与应用》 CSCD 北大核心 2006年第22期158-160,共3页
双聚类模型有助于聚类存在相关性的局部模式。论文提出了一种可识别多种相关模式的双聚类算法,以二次互信息作为相关性标准,并以Parzen窗口法有效估算高维变量之间的互信息;同时提出了最大相关维簇的概念。算法以多个最大相关维簇为种子... 双聚类模型有助于聚类存在相关性的局部模式。论文提出了一种可识别多种相关模式的双聚类算法,以二次互信息作为相关性标准,并以Parzen窗口法有效估算高维变量之间的互信息;同时提出了最大相关维簇的概念。算法以多个最大相关维簇为种子,通过迭代细化聚类,可有效地发现高维数据环境内相关的长模式。真实基因表达数据的实验证明了算法的有效性。 展开更多
关键词 双聚类 二次互信息 基因表达数据
在线阅读 下载PDF
基于二次互信息的特征选择算法
2
作者 李滔 王俊普 +1 位作者 王鹏伟 吴秀清 《中国科学技术大学学报》 CAS CSCD 北大核心 2006年第11期1133-1138,共6页
将二次互信息(mutual information)用作模式分类问题中特征选择的准则,分析了该准则在再生核希尔伯特空间中的几何意义.在二次互信息准则基础上,提出了基于Parzen窗密度估计和后向删除策略的特征选择算法PW-QMI,同时针对大规模数据集的... 将二次互信息(mutual information)用作模式分类问题中特征选择的准则,分析了该准则在再生核希尔伯特空间中的几何意义.在二次互信息准则基础上,提出了基于Parzen窗密度估计和后向删除策略的特征选择算法PW-QMI,同时针对大规模数据集的情况给出了基于高斯混合模型的算法GMM-QMI,以减小算法的计算复杂度.通过与相关度算法和SVM-RFE算法的实验比较,证明了该算法在特征选择问题上具有更为稳定的性能. 展开更多
关键词 二次互信息 特征变量选择 Parzen窗密度估计 高斯混合模型
在线阅读 下载PDF
基于核二次互信息的发酵过程质量预测模型 被引量:1
3
作者 李征 王普 +2 位作者 高学金 齐咏生 高慧慧 《计算机工程与设计》 北大核心 2021年第7期2016-2023,共8页
为提高对发酵过程中质量变量的预测精度,解决发酵数据非线性的问题,提出一种基于核二次互信息回归的质量预测模型。将非线性过程数据核映射至高维特征空间,使其线性可分;基于高维特征空间,使用Renyi二次熵与二次互信息定义目标函数提取... 为提高对发酵过程中质量变量的预测精度,解决发酵数据非线性的问题,提出一种基于核二次互信息回归的质量预测模型。将非线性过程数据核映射至高维特征空间,使其线性可分;基于高维特征空间,使用Renyi二次熵与二次互信息定义目标函数提取过程特征,建立过程特征与质量变量间的回归模型;二次互信息可衡量变量间的非线性关系。仿真实验及大肠杆菌发酵生产数据的实验结果表明,该方法具有较高质量预测精度,对非线性数据有较强处理能力。 展开更多
关键词 二次互信息 特征提取 Renyi 质量预测 发酵过程
在线阅读 下载PDF
联合聚类非线性相关的时序基因表达数据 被引量:5
4
作者 闫雷鸣 孙志挥 +1 位作者 吴英杰 张柏礼 《计算机研究与发展》 EI CSCD 北大核心 2008年第11期1865-1873,共9页
为聚类非线性相关的数据对象,引入广义信息论中二次互信息作为相似性度量,利用矩阵理论降低了二次互信息的计算量,并结合滑动窗口技术,建立了一种时序数据非线性相关模型.在此基础上提出了适用于时序基因表达数据的确定性联合聚类算法MI... 为聚类非线性相关的数据对象,引入广义信息论中二次互信息作为相似性度量,利用矩阵理论降低了二次互信息的计算量,并结合滑动窗口技术,建立了一种时序数据非线性相关模型.在此基础上提出了适用于时序基因表达数据的确定性联合聚类算法MI-TSB.该算法将时序数据转化为抽象字符序列,然后插入到MI-泛化后缀树中,避免了穷举各种组合,从而快速索引全部聚类结果.实验结果显示MI-TSB算法具有良好的运行性能,成功聚类出非线性相关的对象;利用Gene Ontology对聚类结果进行基因注释,也验证了聚类结果的生物学意义. 展开更多
关键词 二次互信息 非线性相关 联合聚类 生物信息 基因表达数据
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部