期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于排序思想的高维稀疏数据聚类 被引量:2
1
作者 祝琴 高学东 +2 位作者 武森 陈敏 陈华 《计算机工程》 CAS CSCD 北大核心 2010年第22期13-14,共2页
针对CABOSFV聚类算法对数据输入顺序的敏感性问题,提出融合排序思想的高属性维稀疏数据聚类算法,通过计算首次聚类中两两高属性维稀疏数据非零属性取值情况确定所需要计算差异度的集合组合,减小了算法复杂度。应用结果表明,该方法能提高... 针对CABOSFV聚类算法对数据输入顺序的敏感性问题,提出融合排序思想的高属性维稀疏数据聚类算法,通过计算首次聚类中两两高属性维稀疏数据非零属性取值情况确定所需要计算差异度的集合组合,减小了算法复杂度。应用结果表明,该方法能提高CABOSFV聚类的质量。 展开更多
关键词 高维稀疏数据 CABOSFV聚类 排序
在线阅读 下载PDF
基于SS/OSF实现高维稀疏数据对象的聚类 被引量:5
2
作者 吴萍 宋瀚涛 +2 位作者 牛振东 张利萍 张聚礼 《北京理工大学学报》 EI CAS CSCD 北大核心 2006年第3期216-220,共5页
为了解决传统聚类方法处理高维稀疏数据对象时聚类结果不理想的问题,提出了SS/OSF聚类方法.该方法基于对象组相似度(SS)和对象组特征向量(OSF),并借助对象组特征向量的可加性实现.采用本方法得到高维稀疏数据对象的聚类结果后,可以根据... 为了解决传统聚类方法处理高维稀疏数据对象时聚类结果不理想的问题,提出了SS/OSF聚类方法.该方法基于对象组相似度(SS)和对象组特征向量(OSF),并借助对象组特征向量的可加性实现.采用本方法得到高维稀疏数据对象的聚类结果后,可以根据聚类结果中各个对象集合的上确界和下确界为新对象进行对象组分类.实验表明,与传统K-means聚类方法相比,随着数据对象数目的增加,该方法无论是在运行时间上,还是在聚类结果的准确度方面都有明显的改进. 展开更多
关键词 高维稀疏二态数据 对象组相似度 对象组特征向量 聚类 分类
在线阅读 下载PDF
基于信息熵的高维稀疏大数据降维算法研究 被引量:20
3
作者 何兴高 李蝉娟 +2 位作者 王瑞锦 邓伏虎 刘行 《电子科技大学学报》 EI CAS CSCD 北大核心 2018年第2期235-241,共7页
数据降维是从高维数据中挖掘有效信息的必要步骤。传统的主成分分析(PCA)算法应用于超高维稀疏数据降维时,存在着无法将所有数据特征一次性读入内存以进行分析计算的问题,而之后提出的分块处理PCA算法由于耗时太长,并不能满足实际需求... 数据降维是从高维数据中挖掘有效信息的必要步骤。传统的主成分分析(PCA)算法应用于超高维稀疏数据降维时,存在着无法将所有数据特征一次性读入内存以进行分析计算的问题,而之后提出的分块处理PCA算法由于耗时太长,并不能满足实际需求。本文引入信息熵的思想对PCA算法进行改进,提出E-PCA算法,先利用信息熵对数据进行特征筛选,剔除大部分无用特征,再使用PCA算法对处理后的超高维稀疏数据进行降维。通过实验结果表明,在保留相同比例原数据信息的情况下,本文提出的基于信息熵的E-PCA算法在内存占用、运行时间以及降维结果都优于分块处理PCA算法。 展开更多
关键词 分块处理 降维处理 高维稀疏数据 信息熵 主成分分析
在线阅读 下载PDF
具有稀疏特征的对象—属性子空间边缘重叠区域归属算法
4
作者 祝琴 陈华 《计算机应用研究》 CSCD 北大核心 2013年第1期99-102,113,共5页
通过分析具有稀疏特征的对象—属性子空间的特征,发现其边缘存在交叉重叠区域现象,为此,提出了基于聚类思想的具有稀疏特征的对象—属性子空间边缘的重叠区域归属算法(OASEDA),该算法能有效解决对象—属性子空间的独立性,算法根据子空... 通过分析具有稀疏特征的对象—属性子空间的特征,发现其边缘存在交叉重叠区域现象,为此,提出了基于聚类思想的具有稀疏特征的对象—属性子空间边缘的重叠区域归属算法(OASEDA),该算法能有效解决对象—属性子空间的独立性,算法根据子空间内部紧凑度和子空间之间分离度相对大小确定子空间边缘重叠区域的归属,并基于K-means算法结合权重理论设计了重叠区域归属判断目标函数,最后通过实验证明了该方法的有效性。 展开更多
关键词 具有稀疏特征的高维数据 对象—属性子空间 对象—属性子空间边缘重叠区域
在线阅读 下载PDF
基于迭代校正的病例临床复杂度度量方法研究
5
作者 陶丽 王纯青 +1 位作者 张自力 陈波 《西南大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第5期185-191,共7页
现有病例临床复杂度(episode clinical complexity,ECC)模型在评估临床复杂程度时主要关注诊断数目的不同,忽略了不同诊断类型造成的差异.本文提出了一种基于迭代校正思想,将诊断数目和诊断类型同时纳入病人费用和病情复杂水平评估过程... 现有病例临床复杂度(episode clinical complexity,ECC)模型在评估临床复杂程度时主要关注诊断数目的不同,忽略了不同诊断类型造成的差异.本文提出了一种基于迭代校正思想,将诊断数目和诊断类型同时纳入病人费用和病情复杂水平评估过程的ECC改进模型(iteration-based ECC,IECC).基于重庆某大型三甲医院2015-2019年呼吸系统、循环系统的病案首页数据的实验结果表明,根据IECC方法估算得到的住院费用与真实费用的相关性有较大提升,说明本文所提方法能够更好地评估病人临床复杂水平,为成功实施以疾病诊断相关分组(diagnosis related groups,DRGs)为核心的付费制度提供有力支持. 展开更多
关键词 病案首页数据 高维稀疏数据 病例临床复杂度度量 迭代校正
在线阅读 下载PDF
基于对象组特征向量的聚类与分类的实现
6
作者 吴萍 张利萍 《计算机工程》 EI CAS CSCD 北大核心 2006年第16期17-19,57,共4页
高维稀疏数据的聚类分析是目前数据挖掘领域内亟待解决的问题之一。传统的聚类方法中,大部分不适用于高维稀疏数据,不能得到满意的结果。该文借助对象组相似度和对象组的特征向量,提出了一种实现聚类的方法。根据聚类结果后,根据聚类集... 高维稀疏数据的聚类分析是目前数据挖掘领域内亟待解决的问题之一。传统的聚类方法中,大部分不适用于高维稀疏数据,不能得到满意的结果。该文借助对象组相似度和对象组的特征向量,提出了一种实现聚类的方法。根据聚类结果后,根据聚类集合的上确界和下确界给出新对象的分类。该方法思想明了,实现起来简单轻松,结果准确可靠。 展开更多
关键词 高维稀疏二态数据 对象组相似度 对象组特征向量 聚类 分类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部