期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于伪柯西类核函数的主成分降维方法 被引量:4
1
作者 刘文博 梁盛楠 《东北师大学报(自然科学版)》 北大核心 2021年第3期30-35,共6页
构造了伪柯西类核函数并给出了相应的理论证明.利用伪柯西类核函数对4个癌症基因表达数据集进行降维,然后利用支持向量机、K近邻和朴素贝叶斯进行分类预测.实验结果表明,与高斯核、多项式核、双曲正切核降维以及全变量情形相比,在多数... 构造了伪柯西类核函数并给出了相应的理论证明.利用伪柯西类核函数对4个癌症基因表达数据集进行降维,然后利用支持向量机、K近邻和朴素贝叶斯进行分类预测.实验结果表明,与高斯核、多项式核、双曲正切核降维以及全变量情形相比,在多数情况下,基于伪柯西类核函数进行的维度约减,可使得目前主流机器学习方法的分类精度达到最优. 展开更多
关键词 降维 柯西函数 分类预测 高维数据
在线阅读 下载PDF
结合柯西核的分类型数据密度峰值聚类算法 被引量:5
2
作者 盛锦超 杜明晶 +1 位作者 李宇蕊 孙嘉睿 《计算机工程与应用》 CSCD 北大核心 2022年第18期162-171,共10页
密度峰值聚类算法在处理分类型数据时难以产生较好的聚类效果。针对该现象,详细分析了其产生的原因:距离计算的重叠问题和密度计算的聚集问题。同时为了解决上述问题,提出了一种面向分类型数据的密度峰值聚类算法(Cauchy kernel-based d... 密度峰值聚类算法在处理分类型数据时难以产生较好的聚类效果。针对该现象,详细分析了其产生的原因:距离计算的重叠问题和密度计算的聚集问题。同时为了解决上述问题,提出了一种面向分类型数据的密度峰值聚类算法(Cauchy kernel-based density peaks clustering for categorical data,CDPCD)。算法首先指出分类型数据距离度量过程中有序特性(分类型数据属性值之间的顺序关系)鲜有考虑的现状,进而提出一种基于概率分布的加权有序距离度量来缓解重叠问题。通过结合柯西核函数,在共享最近邻密度峰值聚类算法基础上重新评估数据密度值,改进了密度计算和二次分配方式,增强了密度多样性,降低了聚集问题带来的影响。多个真实数据集上的实验结果表明,相较于传统的基于划分和密度的聚类算法,CDPCD都取得了更好的聚类结果。 展开更多
关键词 分类型数据 有序特性 密度峰值聚类 柯西核函数 数据挖掘
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部