-
题名基于P2P的自适应分布式k最近邻搜索算法
被引量:1
- 1
-
-
作者
余小高
余小鹏
-
机构
湖北经济学院信息管理学院
武汉工程大学经济管理学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第19期49-52,55,共5页
-
基金
湖北省教育厅基金资助项目"群体决策的知识发现与推理模型和方法研究"(2008d095)
-
文摘
k最近邻搜索算法无法满足数据挖掘的分布性、实时性和可扩展性要求,针对该问题提出基于P2P的自适应分布式k最近邻搜索算法[0](P2PAKNNs)。阐述GHT*结构,定义高维数据相似度函数HDSF(X,Y),论述GHT*中的插入算法、范围查找算法和搜索算法。给出P2PAKNNs的实现过程,通过实验证明其正确性。
-
关键词
k最近邻搜索算法
度量空间
相似性查询
-
Keywords
k-nearest Neighbor search algorithm(kNNs)
metric space
similarity query
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于角相似性的k最近邻搜索研究
- 2
-
-
作者
余小鹏
马费成
-
机构
武汉大学信息资源研究中心
武汉工程大学经济管理学院
-
出处
《情报学报》
CSSCI
北大核心
2009年第1期58-63,共6页
-
基金
国家自然科学基金项目:“Web2.0环境下信息自组织与序化研究(No.70773086)”
湖北省教育厅中青年项目:Web2.0环境下信息自组织的演化仿真与关键支撑技术研究(No.Q20081502)
湖北省教育厅人文社科项目:基于Agent的电子商务推荐系统研究.
-
文摘
在高维空间中k最近邻搜索(KNNS)应用非常广泛,但是目前很多KNNS算法都根据欧氏距离对数据进行索引和搜索,不适合采用角相似性的应用。本文提出一种基于角相似性的k最近邻搜索算法(AS—KNNS)。该算法先提出基于角相似性的数据索引结构(AS-Index),参照一条中心线和一条参照线,将数据以系列壳.超圆锥体方式进行组织并分别线性存储;然后确定查询对象的空间位置,有效确定一个以从原点到查询对象的直线为中心线的超圆锥体并在其中进行搜索。实验结果表明,AS-KNNS算法较其他k最近邻搜索算法有更好的性能。
-
关键词
数据分割
k最近邻搜索
角相似性
壳-超圆锥体
-
Keywords
data partitioning, k-nearest neighbor search, angular similarity, shell-hypercone
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种基于MapReduce的短时交通流预测方法
被引量:11
- 3
-
-
作者
梁轲
谭建军
李英远
-
机构
中国科学院广州地球化学研究所
中国科学院大学
广州中科盛博信息技术有限公一J
-
出处
《计算机工程》
CAS
CSCD
北大核心
2015年第1期174-179,共6页
-
基金
广东省中国科学院全面战略合作基金资助项目(2012B091100266)
广州市科技计划基金资助项目(2010Y1-C041)
广州市科技计划科技支撑基金资助项目(09A11040726)
-
文摘
非参数回归方法是短时交通流预测常用的方法,但现有非参数回归方法存在预测速度与精度之间的矛盾。为此,提出一种适用于海量历史数据、基于Map Reduce与遗传算法的非参数回归短时交通流预测方法。通过引入Map Reduce并行计算框架,加快K最近邻算法的搜索速度。在数据预处理阶段利用遗传算法优化关键参数的设置,并采用Map Reduce加速参数优化过程,以解决遗传算法迭代运算时间长的问题。实验结果表明,该方法在保证交通流预测精度的前提下,明显提高了预测速度,并且具有较好的可伸缩性。
-
关键词
交通流预测
非参数回归
k最近邻搜索
遗传算法
Map
Reduce编程模型
并行计算
-
Keywords
traffic flow forecasting
non-parametric regression
k Nearest Neighbor(kNN)search
genetic algorithm
Map Reduce programming model
parallel computing
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-