-
题名面向混合型属性数据的改进谱聚类算法
- 1
-
-
作者
陈晓曼
陈玉
苏欢
-
机构
哈尔滨工业大学(威海)理学院
呼伦贝尔市卫生健康委员会
-
出处
《陕西师范大学学报(自然科学版)》
北大核心
2025年第1期71-80,共10页
-
基金
山东省自然科学基金面上项目(ZR202102220411)。
-
文摘
混合型属性数据是最为常见的一种数据集类型,针对该类型数据的聚类算法是聚类分析的研究热点之一。由于谱聚类算法具有适合于任意形状数据的聚类问题且能收敛于全局最优解的优势,因而从相似性度量的角度出发,基于杰卡德(Jaccard)距离、马氏(Mahalanobis)距离的思想,设计一种适用于混合型属性数据的相似性度量,并利用其实现谱聚类的混合型属性数据扩展,构建一种改进的谱聚类算法(IJM-SC)。将构建的算法应用于UCI机器学习数据库中心脏病数据集等3个混合型属性数据集进行聚类,验证算法对混合型属性数据聚类的优越性,通过与现有一些算法比较效果指标,结果表明提出算法能够更好地实现对混合型属性数据的聚类。
-
关键词
混合型属性数据
谱聚类
Jaccard距离
马氏距离
-
Keywords
mixed attribute data
spectral clustering
Jaccard distance
Mahalanobis distance
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于邻域粗糙隶属函数的离群点检测
被引量:3
- 2
-
-
作者
杨晓玲
张贤勇
-
机构
四川师范大学数学与软件科学学院
四川师范大学智能信息与量子信息研究所
-
出处
《计算机工程与设计》
北大核心
2019年第2期533-539,共7页
-
基金
国家自然科学基金项目(61673285
61203285)
+1 种基金
四川省青年科技基金项目(2017JQ0046)
四川省教育厅科研基金项目(15ZB0028)
-
文摘
针对传统粗糙集的离群点检测方法难以处理数值型属性数据的问题,提出基于邻域粗糙隶属函数的离群点检测方法,其适用于数据包括数值型、符号型与混合型。基于混合型距离与自适应半径,定义邻域粗糙隶属函数刻画对象离群程度,构建邻域粗糙离群因子实施离群点检测,设计相应的离群点检测算法NRMFOD。UCI数据对比实验结果表明,NRMFOD算法具有有效性,优于3种常用检测算法(RMF、RBD、DIS算法)。
-
关键词
离群点检测
邻域粗糙集
粗糙隶属函数
混合型属性数据
数据挖掘
-
Keywords
outlier detection
neighborhood rough set
rough membership function
hybrid attribute data
data mining
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-