期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于向量内积不等式的分布式k均值聚类算法
被引量:
15
1
作者
倪巍伟
陆介平
孙志挥
《计算机研究与发展》
EI
CSCD
北大核心
2005年第9期1493-1497,共5页
聚类分析是数据挖掘领域的一项重要研究课题.随着数据量的急剧增加,针对大数据集的聚类分析成为一个难点.虽然k均值算法具有易实现、复杂度与数据集大小成线性关系的优点,将其应用于大数据集时仍然存在效率低的问题.分布式聚类是解决这...
聚类分析是数据挖掘领域的一项重要研究课题.随着数据量的急剧增加,针对大数据集的聚类分析成为一个难点.虽然k均值算法具有易实现、复杂度与数据集大小成线性关系的优点,将其应用于大数据集时仍然存在效率低的问题.分布式聚类是解决这一问题的有效方法.在已有分布式聚类算法kDMeans基础上,结合向量内积不等式关系对算法加以优化,提出分布式聚类算法kDCBIP.理论分析和实验结果表明,算法kDCBIP优于kDMeans,可以有效地解决大数据集聚类问题,算法是有效可行的.
展开更多
关键词
分布式聚类
数据点的模
向量
内积
向量内积不等式
在线阅读
下载PDF
职称材料
基于nested-loop的大数据集快速离群点检测算法
被引量:
1
2
作者
倪巍伟
陈耿
+1 位作者
陆介平
孙志挥
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2006年第3期463-466,共4页
针对已有的多数离群点检测算法存在扩展性差,不能有效应用于大数据集的问题,在已有的基于距离的离群点检测算法的基础上,设计模信息表存储结构,利用向量内积不等式关系以及合理的存储分配和调度策略,提出一种高效离群点检测算法DBoda....
针对已有的多数离群点检测算法存在扩展性差,不能有效应用于大数据集的问题,在已有的基于距离的离群点检测算法的基础上,设计模信息表存储结构,利用向量内积不等式关系以及合理的存储分配和调度策略,提出一种高效离群点检测算法DBoda.该算法通过在预处理中存储每个点的模信息,减少点间距离的计算量,并对嵌套循环方法进行优化,进一步减少I/O的开销.理论分析和试验结果表明,所提算法具有时间消耗小和适用于处理大数据集的特点,可以有效地解决离群点检测中的算法时间复杂性和算法扩展性问题.
展开更多
关键词
大数据集
模信息表
向量内积不等式
离群点检测
在线阅读
下载PDF
职称材料
题名
基于向量内积不等式的分布式k均值聚类算法
被引量:
15
1
作者
倪巍伟
陆介平
孙志挥
机构
东南大学计算机科学与工程系
出处
《计算机研究与发展》
EI
CSCD
北大核心
2005年第9期1493-1497,共5页
基金
国家自然科学基金项目(70371015)
教育部高等学校博士学科点专项科研基金项目(20040286009)~~
文摘
聚类分析是数据挖掘领域的一项重要研究课题.随着数据量的急剧增加,针对大数据集的聚类分析成为一个难点.虽然k均值算法具有易实现、复杂度与数据集大小成线性关系的优点,将其应用于大数据集时仍然存在效率低的问题.分布式聚类是解决这一问题的有效方法.在已有分布式聚类算法kDMeans基础上,结合向量内积不等式关系对算法加以优化,提出分布式聚类算法kDCBIP.理论分析和实验结果表明,算法kDCBIP优于kDMeans,可以有效地解决大数据集聚类问题,算法是有效可行的.
关键词
分布式聚类
数据点的模
向量
内积
向量内积不等式
Keywords
distributed clustering
mode of a data point
vectors' inner product
vectors' inner product ineguation
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于nested-loop的大数据集快速离群点检测算法
被引量:
1
2
作者
倪巍伟
陈耿
陆介平
孙志挥
机构
东南大学计算机科学与工程学院
南京审计学院审计信息工程重点实验室
出处
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2006年第3期463-466,共4页
基金
国家自然科学基金资助项目(70371015)
高等学校博士学科点专项科研基金资助项目(20040286009)
审计署审计科研所专项资助项目(SK2006007)
文摘
针对已有的多数离群点检测算法存在扩展性差,不能有效应用于大数据集的问题,在已有的基于距离的离群点检测算法的基础上,设计模信息表存储结构,利用向量内积不等式关系以及合理的存储分配和调度策略,提出一种高效离群点检测算法DBoda.该算法通过在预处理中存储每个点的模信息,减少点间距离的计算量,并对嵌套循环方法进行优化,进一步减少I/O的开销.理论分析和试验结果表明,所提算法具有时间消耗小和适用于处理大数据集的特点,可以有效地解决离群点检测中的算法时间复杂性和算法扩展性问题.
关键词
大数据集
模信息表
向量内积不等式
离群点检测
Keywords
large data set
mode table
vectors' inner product inequation
outlier detection
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于向量内积不等式的分布式k均值聚类算法
倪巍伟
陆介平
孙志挥
《计算机研究与发展》
EI
CSCD
北大核心
2005
15
在线阅读
下载PDF
职称材料
2
基于nested-loop的大数据集快速离群点检测算法
倪巍伟
陈耿
陆介平
孙志挥
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2006
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部