期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于模型的非凸聚类算法
1
作者 钟卓辉 陈黎飞 《计算机工程与科学》 CSCD 北大核心 2024年第2期292-302,共11页
由于数据可能分布在非规则的流形上,其中潜在的簇往往呈现非凸的形状和结构,针对这类数据的聚类问题被统称为非凸聚类。现有的主流非凸聚类方法包括基于原始空间的方法和基于空间变换的方法,均忽略了非凸数据模式的显式描述。提出一种... 由于数据可能分布在非规则的流形上,其中潜在的簇往往呈现非凸的形状和结构,针对这类数据的聚类问题被统称为非凸聚类。现有的主流非凸聚类方法包括基于原始空间的方法和基于空间变换的方法,均忽略了非凸数据模式的显式描述。提出一种描述性模型用于非凸聚类。首先,基于核密度方法定义了一种具有混合形式的特征加权核密度模型,其无需事先假定任何概率分布模型且不限制簇的形状,这是传统基于模型的聚类方法无法实现的。其次,基于提出的模型推导了聚类目标函数,并基于期望最大化算法提出一种求解密度函数局部区域密度极大值的优化算法,那些上升到密度函数相同密度极大值的样本点被划分为同一个簇。最后,定义了一种基于模型的非凸聚类算法。算法不需人为定义簇的数量,并且能够为每个簇分配一个显式的概率密度函数,有助于更稳健和更准确地表征集群。除此之外,算法不仅在优化过程中进行自适应带宽选择,而且在优化过程中赋予了样本空间特征权重,实现了嵌入式特征选择。 展开更多
关键词 非凸 描述性模型 基于模型 特征选择 核密度估计 局部密度极大值
在线阅读 下载PDF
基因表达聚类分析技术的现状与发展 被引量:7
2
作者 杨春梅 万柏坤 高晓峰 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2003年第6期974-979,共6页
随着多个生物基因组测序的完成、DNA芯片技术的广泛应用 ,基因表达数据分析已成为后基因组时代的研究热点 .聚类分析能将功能相关的基因按表达谱的相似程度归纳成类 ,有助于对未知功能的基因进行研究 ,是目前基因表达分析研究的主要计... 随着多个生物基因组测序的完成、DNA芯片技术的广泛应用 ,基因表达数据分析已成为后基因组时代的研究热点 .聚类分析能将功能相关的基因按表达谱的相似程度归纳成类 ,有助于对未知功能的基因进行研究 ,是目前基因表达分析研究的主要计算技术之一 .已有多种聚类分析算法用于基因表达数据分析 ,各种算法因其着眼点、原理等方面的差异 ,而各有其优缺点 .如何对各种聚类算法的有效性进行分析、并开发新型的。 展开更多
关键词 基因表达 分析技术 DNA芯片 非监督 监督 基于模型聚类
在线阅读 下载PDF
时间序列分类问题的算法比较 被引量:43
3
作者 杨一鸣 潘嵘 +2 位作者 潘嘉林 杨强 李磊 《计算机学报》 EI CSCD 北大核心 2007年第8期1259-1266,共8页
时间序列分类是时间序列数据分析中的重要任务之一.不同于时间序列分析中常用的算法与问题,时间序列分类是要把整个时间序列当作输入,其目的是要赋予这个序列某个离散标记.它比一般分类问题困难,主要在于要分类的时间序列数据不等长,这... 时间序列分类是时间序列数据分析中的重要任务之一.不同于时间序列分析中常用的算法与问题,时间序列分类是要把整个时间序列当作输入,其目的是要赋予这个序列某个离散标记.它比一般分类问题困难,主要在于要分类的时间序列数据不等长,这使得一般的分类算法不能直接应用.即使是等长的时间序列,由于不同序列在相同位置的数值一般不可直接比较,一般的分类算法依然还是不适合直接应用.为了解决这些难点,通常有两种方法:第一,定义合适的距离度量(这里,最常用的距离度量是DTW距离),使得在此度量意义下相近的序列有相同的分类标签,这类方法属于领域无关的方法;第二,首先对时间序列建模(利用序列中前后数据的依赖关系建立模型),再用模型参数组成等长向量来表示每条序列,最后用一般的分类算法进行训练和分类,这类方法属于领域相关的方法.长期以来,研究者往往只倾向于使用其中一种算法,而这两类算法的比较却比较缺乏.文中深入分析了这两类方法,并且分别在不同的合成数据集和实际数据集上比较了两类方法.作者观测到了两类算法在不同因素影响下的性能表现,从而为今后发展新的算法提供了有力依据. 展开更多
关键词 时间序列 基于模型聚类 马尔可夫模型 统计学习
在线阅读 下载PDF
基于多项式有限混合模型的Slope One算法改进 被引量:1
4
作者 陈平华 王旭彬 洪英汉 《计算机工程与科学》 CSCD 北大核心 2016年第4期761-767,共7页
针对多项式有限混合模型参数估计过程中存在的初始化依赖、参数易收敛到边界值以及容易陷入局部最优等问题,引入了最小信息长度准则,优化多项式有限混合模型的参数估计过程。在此基础上,采用基于多项式有限混合模型的聚类算法对用户评... 针对多项式有限混合模型参数估计过程中存在的初始化依赖、参数易收敛到边界值以及容易陷入局部最优等问题,引入了最小信息长度准则,优化多项式有限混合模型的参数估计过程。在此基础上,采用基于多项式有限混合模型的聚类算法对用户评分行为进行聚类,利用模型求解得到的聚类归属概率对Slope One算法实施改进。实验结果表明:应用最小信息长度准则对多项式有限混合模型进行优化后,聚类效果明显提高;同时,相比于基于用户聚类的Slope One推荐算法,改进算法具有明显的改进效果。 展开更多
关键词 有限混合模型 SLOPE ONE 基于模型聚类 协同过滤
在线阅读 下载PDF
管道流量泄漏时间序列分类的算法研究
5
作者 周鹏 《计算机工程与应用》 CSCD 北大核心 2009年第13期166-169,共4页
时间序列分类比一般分类问题困难,主要在于要分类的时间序列数据不等长,因此不能直接应用一般的分类算法。首先提出基于聚类模型的数据转换,然后进行基于模型的聚类分析,用领域相关法对时间序列建模,用模型参数组成等长向量来表示每条序... 时间序列分类比一般分类问题困难,主要在于要分类的时间序列数据不等长,因此不能直接应用一般的分类算法。首先提出基于聚类模型的数据转换,然后进行基于模型的聚类分析,用领域相关法对时间序列建模,用模型参数组成等长向量来表示每条序列,最后进行时间序列匹配算法分析,用分类算法进行训练和分类。结合管道流量泄漏点提出一种时间序列匹配的新方法,利用同类样本间的连续性规律,将时间序列排序,并在相邻的时间序列之间添加样本点,新方法优于基于动态时间弯折的传统方法;针对管道流量泄漏时间序列分类的算法研究观测到不同算法在不同因素影响下的性能表现,为今后发展新的算法提供有力依据。 展开更多
关键词 时间序列 基于模型聚类 马尔可夫模型 动态时间弯折
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部