-
题名基于同构化角度的离群检测方法
- 1
-
-
作者
裴正中
赵旭俊
-
机构
太原科技大学计算机科学与技术学院
-
出处
《计算机工程与设计》
北大核心
2024年第12期3622-3630,共9页
-
基金
国家自然科学基金项目(61572343)
山西省应用基础研究计划基金项目(20210302123223)。
-
文摘
针对基于角度的离群检测方法普遍存在的计算成本高昂,且对超参数选择依赖性强的问题,提出一种基于角度的快速非参数方法HAOD。对数据集进行中心化处理并使用极坐标描;在此基础上,提出一种向量夹角计算函数的近似表示方法,采用该方法将向量夹角用一维顺序结构表示,提升检测效率;引入经验累积分布函数分别计算向量夹角及向量模长的尾部概率,将其作为单维度尾部得分;改进单维度尾部得分的聚合方式,对原始向量及其反转向量的尾部得分进行聚合,获取最终离群得分。在ODDS和UCI高维数据集上进行实验,其结果表明,HAOD在检测效率上优于5种对比方法,分别平均提高了28.74%至84.71%。
-
关键词
高维数据
离群检测
基于角度
数据同构化
极坐标表示
经验累积分布函数
偏度
-
Keywords
high-dimensional data
outlier detection
angle-based
data homogeneity
polar coordinate representation
empirical cumulative distribution function
skewness
-
分类号
TP311.1
[自动化与计算机技术—计算机软件与理论]
-