期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
面向超大规模数据的自适应谱聚类算法 被引量:1
1
作者 毕志臻 杨德刚 冯骥 《智能系统学报》 CSCD 北大核心 2023年第2期251-259,共9页
针对超大规模数据聚类过程中人为设定邻域参数及计算量庞大等问题,提出了一种基于近似自然近邻的自适应超大规模谱聚类算法(approximate natural nearest neighbor based self-adaptive ultra-scalable spectral clustering algorithm, ... 针对超大规模数据聚类过程中人为设定邻域参数及计算量庞大等问题,提出了一种基于近似自然近邻的自适应超大规模谱聚类算法(approximate natural nearest neighbor based self-adaptive ultra-scalable spectral clustering algorithm, AN^(3)-SUSC)。该算法首先通过混合代表选取缩小数据规模,在此基础上利用近似自然近邻自适应地确定局部邻域参数并构建相似矩阵,最后运用二部图进行迁移分割将数据空间映射到原超大规模数据空间中并完成谱聚类分析。超大规模数据集实验结果表明,该算法对超大规模数据集聚类效果有所提升,并且降低计算规模同时具有较高的鲁棒性和较强的自适应性。 展开更多
关键词 数据聚类 超大规模 近似自然近邻 谱聚类 自然邻居 二部图 自适应 无参数
在线阅读 下载PDF
基于知识关系与试题价值权重的认知诊断模型
2
作者 魏延 刘承松 《华南师范大学学报(自然科学版)》 CAS 北大核心 2024年第4期91-99,共9页
现有认知诊断方法忽略了试题中知识点之间存在的显性、隐性相关性以及试题的价值权重,为解决上述问题,文章提出了一种基于神经网络的诊断模型(QENCD)。该模型首先利用Jaccard算法探索知识点间的相似性,发现试题中的显性知识点,并根据特... 现有认知诊断方法忽略了试题中知识点之间存在的显性、隐性相关性以及试题的价值权重,为解决上述问题,文章提出了一种基于神经网络的诊断模型(QENCD)。该模型首先利用Jaccard算法探索知识点间的相似性,发现试题中的显性知识点,并根据特征向量中心性算法求其权重;其次,利用显性知识点信息作为先验信息来推断试题中的隐性知识点;然后,引入学生潜能因素和试题价值权重因素,重新构建交互函数;最后,结合猜测因素预测学生是否能正确回答试题,了解学生实际水平。在4个真实数据集(ASSIST0910、MathEC、Junyi和Math1)上,将QENCD模型与3个统计认知诊断模型(IRT、MIRT、DINA)、3个神经网络认知诊断模型(NCD、CDGK、ICD)进行对比实验;同时,为了验证每个组件的有效性,进行了消融试验,通过移除模型的不同部分(如知识矩阵、试题价值权重等)来评估各部分对模型性能的影响。此外,进行了基于一致性程度指标(DOA)的可解释性实验,以衡量模型的解释能力。对比实验结果表明在4个真实数据集上,与目前最佳的基线模型(ICD)相比,QENCD模型的ACC、AUC平均提高了0.84%、1.12%,RMSE降低了0.38%。消融实验结果显示:模型的不同部分对模型的准确性和解释性都有重要贡献。由4个模型(DINA、NCDM、CDGK和QENCD)在4个真实数据集上的DOA值可知:QENCD模型能够更准确地识别和解释学生的知识状态。 展开更多
关键词 认知诊断 Jaccard算法 知识相关性 试题价值权重
在线阅读 下载PDF
一种去除聚类数量和邻域参数设置的自适应聚类算法 被引量:3
3
作者 张柏恺 杨德刚 冯骥 《计算机工程与科学》 CSCD 北大核心 2021年第10期1838-1847,共10页
传统聚类方法往往无法避免邻域参数和聚类数量的选择问题,而这些参数在不同形状的数据中的最优选择也不尽相同,需要根据大量先验知识确定合适的参数选择范围。针对上述参数选择问题,提出了一种基于自然邻居思想的边界剥离聚类算法NaN-BP... 传统聚类方法往往无法避免邻域参数和聚类数量的选择问题,而这些参数在不同形状的数据中的最优选择也不尽相同,需要根据大量先验知识确定合适的参数选择范围。针对上述参数选择问题,提出了一种基于自然邻居思想的边界剥离聚类算法NaN-BP,能够在无需设置邻域参数和聚类数量的情况下得到令人满意的聚类结果。算法核心思想是首先根据数据集的分布特征,自适应迭代至对数稳定状态并获取邻域信息,并根据该邻域信息进行边界点的标记与剥离,最终以核心点为数据簇中心进行聚类。在不同规模不同分布的数据集上进行了广泛的对比实验,实验结果表明了NaN-BP的自适应性和有效性,取得了令人满意的实验结果。 展开更多
关键词 聚类分析 自适应 自然邻居 对数稳定状态 核心点
在线阅读 下载PDF
基于扩展自然邻居的无参分类方法
4
作者 曹文态 杨德刚 冯骥 《计算机工程与科学》 CSCD 北大核心 2021年第9期1692-1699,共8页
基于k-最近邻(kNN)的分类方法是实现各种高性能模式识别技术的基础,然而这些方法很容易受到邻域参数k的影响,在完全不了解数据集特性的情况下想要得出各种数据集的邻域是比较困难的。基于上述问题,介绍了一种新的监督分类方法:扩展自然... 基于k-最近邻(kNN)的分类方法是实现各种高性能模式识别技术的基础,然而这些方法很容易受到邻域参数k的影响,在完全不了解数据集特性的情况下想要得出各种数据集的邻域是比较困难的。基于上述问题,介绍了一种新的监督分类方法:扩展自然邻居(ENaN)方法,并证明了该方法在不人为选择邻域参数的情况下提供了一种更好的分类结果。与原有的基于kNN需要先验k的方法不同,ENaN方法在不同的阶段预测不同的k值。因此,无论是在训练阶段还是在测试阶段,ENaN方法都能从动态邻域信息中学习到更多的信息,从而提供更好的分类结果。在不同类型不同规模的真实数据上的分类检测结果均表明了ENaN方法的有效性。 展开更多
关键词 分类分析 最近邻 无参数 扩展自然邻居 动态邻域
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部