期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
具有抗噪性能适用高维数据的增量式聚类算法
被引量:
10
1
作者
邵俊健
王士同
《计算机科学与探索》
CSCD
北大核心
2019年第9期1553-1566,共14页
针对含有噪声的高维数据的聚类问题,提出一种使用新的距离度量方式的增量式聚类算法ANFCM(c+p)。由于传统的模糊C均值聚类算法对初始化聚类中心比较敏感,所提出的聚类算法将单程FCM的增量机制(称为SpFCM)与FCPM中使用的初始化聚类中心...
针对含有噪声的高维数据的聚类问题,提出一种使用新的距离度量方式的增量式聚类算法ANFCM(c+p)。由于传统的模糊C均值聚类算法对初始化聚类中心比较敏感,所提出的聚类算法将单程FCM的增量机制(称为SpFCM)与FCPM中使用的初始化聚类中心的策略相结合,即将先前数据块的聚类中心附近的几个样本点添加到下一个数据块进行聚类,以避免FCM对噪声的敏感性。此外,所提出的聚类算法使用一种新的改进后的距离度量的同时,使用修正后的约束条件和目标函数。通过以上改进,可以有效区分已知类和未知类在算法中的不同影响程度,并加强类之间的相互影响程度。实验结果表明,该算法对高维噪声数据具有很好的聚类效果和鲁棒性。
展开更多
关键词
高斯噪声
增量式聚类算法
距离度量
高维数据
FCPM
算法
在线阅读
下载PDF
职称材料
高维数据的增量式聚类算法的距离度量选择研究
被引量:
7
2
作者
邵俊健
王士同
《计算机工程与科学》
CSCD
北大核心
2019年第2期214-223,共10页
合适的距离度量函数对于聚类结果有重要的影响。针对大规模高维数据集,使用增量式聚类算法进行距离度量的选择分析。SpFCM算法是将大规模数据集分成小样本进行增量分批聚类,可在有限的计算机内存中获得较好的聚类结果。在传统的SpFCM算...
合适的距离度量函数对于聚类结果有重要的影响。针对大规模高维数据集,使用增量式聚类算法进行距离度量的选择分析。SpFCM算法是将大规模数据集分成小样本进行增量分批聚类,可在有限的计算机内存中获得较好的聚类结果。在传统的SpFCM算法的基础上,使用不同的距离度量函数来衡量样本之间的相似性,以得出不同的距离度量对SpFCM算法的影响。在不同的大规模高维数据集中,使用欧氏距离、余弦距离、相关系数距离和扩展的杰卡德距离来计算距离。实验结果表明,后3个距离度量相对于欧氏距离可以很大程度地提高聚类效果,其中相关系数距离可以得到较好的结果,余弦距离和扩展的杰卡德距离效果比较一般。
展开更多
关键词
高维数据
SpFCM
算法
距离度量
增量式
模糊
聚
类
算法
相关系数距离度量
在线阅读
下载PDF
职称材料
增量式CURE聚类算法研究
被引量:
9
3
作者
冯兴杰
黄亚楼
《小型微型计算机系统》
CSCD
北大核心
2004年第10期1847-1849,共3页
聚类是一种非常有用的数据挖掘方法 ,可用于发现隐藏在数据背后的分组和数据分布信息 .目前已经提出了许多聚类算法及其变种 ,但在增量式聚类算法研究方面所作的工作较少 .当数据集因更新而发生变化时 ,数据挖掘的结果也应该进行相应的...
聚类是一种非常有用的数据挖掘方法 ,可用于发现隐藏在数据背后的分组和数据分布信息 .目前已经提出了许多聚类算法及其变种 ,但在增量式聚类算法研究方面所作的工作较少 .当数据集因更新而发生变化时 ,数据挖掘的结果也应该进行相应的更新 .由于数据量大 ,在更新后的数据集上重新执行聚类算法以更新挖掘结果显然比较低效 ,因此亟待研究增量式聚类算法 .通过对 CURE聚类算法的改进 ,提出了一种高效的增量式 CU RE聚类算法 .它能够很好的解决传统聚类算法在伸缩性、数据定期更新时所面临的问题 .
展开更多
关键词
数据挖掘
CURE
聚
类
算法
最近邻
增量式聚类算法
在线阅读
下载PDF
职称材料
增量式K-Medoids聚类算法
被引量:
9
4
作者
高小梅
冯云
冯兴杰
《计算机工程》
CAS
CSCD
北大核心
2005年第B07期181-183,共3页
聚类是一种非常有用的数据挖掘方法,可用于发现隐藏在数据背后的分组和数据分布信息。目前已经提出了许多聚类算法及其变种,但在增量式聚类算法研究方面所做的工作较少。当数据集因更新而发生变化时,数据挖掘的结果也应该进行相应的更...
聚类是一种非常有用的数据挖掘方法,可用于发现隐藏在数据背后的分组和数据分布信息。目前已经提出了许多聚类算法及其变种,但在增量式聚类算法研究方面所做的工作较少。当数据集因更新而发生变化时,数据挖掘的结果也应该进行相应的更新。由于数据量大,在更新后的数据集上重新执行聚类算法以更新挖掘结果显然比较低效,因此亟待研究增量式聚类算法。该文通过对K-Medoids聚类算法的改进,提出一种增量式K-Medoids聚类算法。它能够很好地解决传统聚类算法在伸缩性、数据定期更新时所面临的问题。
展开更多
关键词
数据挖掘
K—Medoids
聚
类
算法
最近邻
增量式聚类算法
在线阅读
下载PDF
职称材料
基于密度的增量式网格聚类算法(英文)
被引量:
45
5
作者
陈宁
陈安
周龙骧
《软件学报》
EI
CSCD
北大核心
2002年第1期1-7,共7页
提出基于密度的网格聚类算法GDCA,发现大规模空间数据库中任意形状的聚类.该算法首先将数据空间划分成若干体积相同的单元,然后对单元进行聚类.只有密度不小于给定阈值的单元才得到扩展,从而大大降低了时间复杂性.在GDCA的基础上,给出...
提出基于密度的网格聚类算法GDCA,发现大规模空间数据库中任意形状的聚类.该算法首先将数据空间划分成若干体积相同的单元,然后对单元进行聚类.只有密度不小于给定阈值的单元才得到扩展,从而大大降低了时间复杂性.在GDCA的基础上,给出增量式聚类算法IGDCA,适用于数据的批量更新.
展开更多
关键词
增量式
网格
聚
类
算法
密度
空间数据库
IGDCA
在线阅读
下载PDF
职称材料
在线新闻主题检测系统的设计与应用
被引量:
7
6
作者
万小军
杨建武
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2004年第z1期42-46,共5页
利用主题检测技术可以从海量新闻信息中实时检测到主题信息,从而将新闻信息按照主题组织并加以利用.文中通过改进加窗策略,采用自适应倒排文档频率,设计了一个中文新闻主题检测系统并进行了实验.结果表明了该系统的有效性.该系统在新华...
利用主题检测技术可以从海量新闻信息中实时检测到主题信息,从而将新闻信息按照主题组织并加以利用.文中通过改进加窗策略,采用自适应倒排文档频率,设计了一个中文新闻主题检测系统并进行了实验.结果表明了该系统的有效性.该系统在新华网数据中心的成功应用进一步表明系统达到了实用需求.
展开更多
关键词
主题检测
增量式聚类算法
加窗策略
自适应倒排文档频率
在线阅读
下载PDF
职称材料
题名
具有抗噪性能适用高维数据的增量式聚类算法
被引量:
10
1
作者
邵俊健
王士同
机构
江南大学数字媒体学院
出处
《计算机科学与探索》
CSCD
北大核心
2019年第9期1553-1566,共14页
基金
国家自然科学基金~~
文摘
针对含有噪声的高维数据的聚类问题,提出一种使用新的距离度量方式的增量式聚类算法ANFCM(c+p)。由于传统的模糊C均值聚类算法对初始化聚类中心比较敏感,所提出的聚类算法将单程FCM的增量机制(称为SpFCM)与FCPM中使用的初始化聚类中心的策略相结合,即将先前数据块的聚类中心附近的几个样本点添加到下一个数据块进行聚类,以避免FCM对噪声的敏感性。此外,所提出的聚类算法使用一种新的改进后的距离度量的同时,使用修正后的约束条件和目标函数。通过以上改进,可以有效区分已知类和未知类在算法中的不同影响程度,并加强类之间的相互影响程度。实验结果表明,该算法对高维噪声数据具有很好的聚类效果和鲁棒性。
关键词
高斯噪声
增量式聚类算法
距离度量
高维数据
FCPM
算法
Keywords
Gaussian noise
incremental clustering algorithm
distance measure
high dimensional data
fuzzy (c+p) means clustering (FCPM) algorithm
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
高维数据的增量式聚类算法的距离度量选择研究
被引量:
7
2
作者
邵俊健
王士同
机构
江南大学数字媒体学院
出处
《计算机工程与科学》
CSCD
北大核心
2019年第2期214-223,共10页
文摘
合适的距离度量函数对于聚类结果有重要的影响。针对大规模高维数据集,使用增量式聚类算法进行距离度量的选择分析。SpFCM算法是将大规模数据集分成小样本进行增量分批聚类,可在有限的计算机内存中获得较好的聚类结果。在传统的SpFCM算法的基础上,使用不同的距离度量函数来衡量样本之间的相似性,以得出不同的距离度量对SpFCM算法的影响。在不同的大规模高维数据集中,使用欧氏距离、余弦距离、相关系数距离和扩展的杰卡德距离来计算距离。实验结果表明,后3个距离度量相对于欧氏距离可以很大程度地提高聚类效果,其中相关系数距离可以得到较好的结果,余弦距离和扩展的杰卡德距离效果比较一般。
关键词
高维数据
SpFCM
算法
距离度量
增量式
模糊
聚
类
算法
相关系数距离度量
Keywords
high dimensional data
SpFCM algorithm
distance metric
incremental fuzzy clustering algorithm
correlation coefficient distance metric
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
增量式CURE聚类算法研究
被引量:
9
3
作者
冯兴杰
黄亚楼
机构
中国民用航空学院计算机科学与技术学院
南开大学软件科学学院
出处
《小型微型计算机系统》
CSCD
北大核心
2004年第10期1847-1849,共3页
基金
教育部科学技术研究重点项目资助 (重点 0 2 0 3 8)
南开大学亚洲研究中心资助 ( AS0 40 5 )
文摘
聚类是一种非常有用的数据挖掘方法 ,可用于发现隐藏在数据背后的分组和数据分布信息 .目前已经提出了许多聚类算法及其变种 ,但在增量式聚类算法研究方面所作的工作较少 .当数据集因更新而发生变化时 ,数据挖掘的结果也应该进行相应的更新 .由于数据量大 ,在更新后的数据集上重新执行聚类算法以更新挖掘结果显然比较低效 ,因此亟待研究增量式聚类算法 .通过对 CURE聚类算法的改进 ,提出了一种高效的增量式 CU RE聚类算法 .它能够很好的解决传统聚类算法在伸缩性、数据定期更新时所面临的问题 .
关键词
数据挖掘
CURE
聚
类
算法
最近邻
增量式聚类算法
Keywords
data mining
CURE
nearest neighbor
incremental clustering algorithm
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
增量式K-Medoids聚类算法
被引量:
9
4
作者
高小梅
冯云
冯兴杰
机构
中国民航学院计算机科学与技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2005年第B07期181-183,共3页
文摘
聚类是一种非常有用的数据挖掘方法,可用于发现隐藏在数据背后的分组和数据分布信息。目前已经提出了许多聚类算法及其变种,但在增量式聚类算法研究方面所做的工作较少。当数据集因更新而发生变化时,数据挖掘的结果也应该进行相应的更新。由于数据量大,在更新后的数据集上重新执行聚类算法以更新挖掘结果显然比较低效,因此亟待研究增量式聚类算法。该文通过对K-Medoids聚类算法的改进,提出一种增量式K-Medoids聚类算法。它能够很好地解决传统聚类算法在伸缩性、数据定期更新时所面临的问题。
关键词
数据挖掘
K—Medoids
聚
类
算法
最近邻
增量式聚类算法
Keywords
Data mining
K-Medoids
Nearest neighbor
Incremental clustering algorithm
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于密度的增量式网格聚类算法(英文)
被引量:
45
5
作者
陈宁
陈安
周龙骧
机构
中国科学院数学与系统科学研究院
中国科学院科技政策与管理科学研究所
出处
《软件学报》
EI
CSCD
北大核心
2002年第1期1-7,共7页
基金
国家自然科学基金
国家重点基础研究发展规划973资助项目~~
文摘
提出基于密度的网格聚类算法GDCA,发现大规模空间数据库中任意形状的聚类.该算法首先将数据空间划分成若干体积相同的单元,然后对单元进行聚类.只有密度不小于给定阈值的单元才得到扩展,从而大大降低了时间复杂性.在GDCA的基础上,给出增量式聚类算法IGDCA,适用于数据的批量更新.
关键词
增量式
网格
聚
类
算法
密度
空间数据库
IGDCA
Keywords
clustering
grid
incremental algorithm
分类号
TP392 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
在线新闻主题检测系统的设计与应用
被引量:
7
6
作者
万小军
杨建武
机构
北京大学计算机科学技术研究所
出处
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2004年第z1期42-46,共5页
文摘
利用主题检测技术可以从海量新闻信息中实时检测到主题信息,从而将新闻信息按照主题组织并加以利用.文中通过改进加窗策略,采用自适应倒排文档频率,设计了一个中文新闻主题检测系统并进行了实验.结果表明了该系统的有效性.该系统在新华网数据中心的成功应用进一步表明系统达到了实用需求.
关键词
主题检测
增量式聚类算法
加窗策略
自适应倒排文档频率
Keywords
topic detection
incremental clustering algorithm
time window strategy
self-adaptive inverse document frequency
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
具有抗噪性能适用高维数据的增量式聚类算法
邵俊健
王士同
《计算机科学与探索》
CSCD
北大核心
2019
10
在线阅读
下载PDF
职称材料
2
高维数据的增量式聚类算法的距离度量选择研究
邵俊健
王士同
《计算机工程与科学》
CSCD
北大核心
2019
7
在线阅读
下载PDF
职称材料
3
增量式CURE聚类算法研究
冯兴杰
黄亚楼
《小型微型计算机系统》
CSCD
北大核心
2004
9
在线阅读
下载PDF
职称材料
4
增量式K-Medoids聚类算法
高小梅
冯云
冯兴杰
《计算机工程》
CAS
CSCD
北大核心
2005
9
在线阅读
下载PDF
职称材料
5
基于密度的增量式网格聚类算法(英文)
陈宁
陈安
周龙骧
《软件学报》
EI
CSCD
北大核心
2002
45
在线阅读
下载PDF
职称材料
6
在线新闻主题检测系统的设计与应用
万小军
杨建武
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2004
7
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部