期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种基于半监督的大规模数据集聚类算法
被引量:
1
1
作者
申彦
宋顺林
朱玉全
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2011年第4期372-382,共11页
待挖掘数据集规模的不断增长,以往的聚类算法由于需要多次扫描原始数据集而不再适用,现阶段,一遍扫描原始数据集即完成聚类的算法成为了首要的研究目标.但是,现有针对大规模数据集的算法容易受到初始化参数以及原始数据集分布的影响,聚...
待挖掘数据集规模的不断增长,以往的聚类算法由于需要多次扫描原始数据集而不再适用,现阶段,一遍扫描原始数据集即完成聚类的算法成为了首要的研究目标.但是,现有针对大规模数据集的算法容易受到初始化参数以及原始数据集分布的影响,聚类结果质量不高,并且也不稳定.对此,吸收半监督聚类的思想,提出了基于标记集的半监督一遍扫描K均值算法,该算法利用驻留主存的标记集指导聚类过程,使得聚类效率以及聚类结果的质量得到了进一步的提高.在人工生成数据集以及1998KDD数据集上验证了该算法的有效性.
展开更多
关键词
大规模数据集聚类
半监督聚
类
聚
类
数据
压缩
数据
挖掘
K均值聚
类
在线阅读
下载PDF
职称材料
分块自适应加权改进大规模概率模糊聚类
被引量:
2
2
作者
景慎艳
刘松迪
《火力与指挥控制》
CSCD
北大核心
2021年第12期88-93,共6页
为解决传统基于贝叶斯理论的概率模糊聚类(BayesianFuzzyClustering,BFC)算法在处理大规模数据集聚类时的时间开销和存储代价瓶颈,提出基于数据分块的单程自适应加权BFC算法,算法在大规模数据集分块的基础上,设计了基于数据加权的改进BF...
为解决传统基于贝叶斯理论的概率模糊聚类(BayesianFuzzyClustering,BFC)算法在处理大规模数据集聚类时的时间开销和存储代价瓶颈,提出基于数据分块的单程自适应加权BFC算法,算法在大规模数据集分块的基础上,设计了基于数据加权的改进BFC算法,用于数据分块内数据聚类,以挑选出对聚类贡献最具代表的标识数据及其自适应权值,在块间迭代聚类过程中,将标识数据及其权值合并到下一数据块中并参与聚类,从而将上一数据块的聚类信息有效地传递到下一数据块中,最后分析算法的收敛性和时间复杂度。实验结果表明,算法在继承传统BFC算法良好聚类性能基础上,减少计算复杂度,有效提高聚类效率,适用于大规模数据集聚类。
展开更多
关键词
大规模数据集聚类
数据
分块
加权概率模糊聚
类
自适应
数据
加权
聚
类
信息传递
在线阅读
下载PDF
职称材料
题名
一种基于半监督的大规模数据集聚类算法
被引量:
1
1
作者
申彦
宋顺林
朱玉全
机构
江苏大学计算机科学与通信工程学院
出处
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2011年第4期372-382,共11页
基金
国家科技支撑计划项目(2010BAI88B00)
江苏省自然科学基金(BK2010331)
+1 种基金
博士研究生创新计划(CX10B-016X)
江苏大学高级人才基金(08JDG057)
文摘
待挖掘数据集规模的不断增长,以往的聚类算法由于需要多次扫描原始数据集而不再适用,现阶段,一遍扫描原始数据集即完成聚类的算法成为了首要的研究目标.但是,现有针对大规模数据集的算法容易受到初始化参数以及原始数据集分布的影响,聚类结果质量不高,并且也不稳定.对此,吸收半监督聚类的思想,提出了基于标记集的半监督一遍扫描K均值算法,该算法利用驻留主存的标记集指导聚类过程,使得聚类效率以及聚类结果的质量得到了进一步的提高.在人工生成数据集以及1998KDD数据集上验证了该算法的有效性.
关键词
大规模数据集聚类
半监督聚
类
聚
类
数据
压缩
数据
挖掘
K均值聚
类
Keywords
scalable datasets clustering
semi-supervised clustering
mined data compression
data mining
kmeans
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
分块自适应加权改进大规模概率模糊聚类
被引量:
2
2
作者
景慎艳
刘松迪
机构
辽宁对外经贸学院大数据研究院
吉林大学软件学院
出处
《火力与指挥控制》
CSCD
北大核心
2021年第12期88-93,共6页
文摘
为解决传统基于贝叶斯理论的概率模糊聚类(BayesianFuzzyClustering,BFC)算法在处理大规模数据集聚类时的时间开销和存储代价瓶颈,提出基于数据分块的单程自适应加权BFC算法,算法在大规模数据集分块的基础上,设计了基于数据加权的改进BFC算法,用于数据分块内数据聚类,以挑选出对聚类贡献最具代表的标识数据及其自适应权值,在块间迭代聚类过程中,将标识数据及其权值合并到下一数据块中并参与聚类,从而将上一数据块的聚类信息有效地传递到下一数据块中,最后分析算法的收敛性和时间复杂度。实验结果表明,算法在继承传统BFC算法良好聚类性能基础上,减少计算复杂度,有效提高聚类效率,适用于大规模数据集聚类。
关键词
大规模数据集聚类
数据
分块
加权概率模糊聚
类
自适应
数据
加权
聚
类
信息传递
Keywords
large-scale data sets clustering
data block partition
weighted probability fuzzy clustering
adaptive data weighting
cluster information
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种基于半监督的大规模数据集聚类算法
申彦
宋顺林
朱玉全
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2011
1
在线阅读
下载PDF
职称材料
2
分块自适应加权改进大规模概率模糊聚类
景慎艳
刘松迪
《火力与指挥控制》
CSCD
北大核心
2021
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部