-
题名基于中心距序降维的聚类算法
被引量:1
- 1
-
-
作者
向剑平
唐常杰
郑皎凌
易树鸿
-
机构
遵义师范学院计算机科学系
四川大学计算机学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第12期58-60,63,共4页
-
基金
国家自然科学基金资助项目(60773169)
贵州省科技厅自然科学基金资助项目(黔科合J字[2010])
遵义市科技局自然科学基金资助项目(遵市科合社字[2009]27号)
-
文摘
为提高金融业务数据集上的聚类质量和聚类效率,提出簇的直径、簇间的相似度这2个概念。利用距离尺度降维的中心距序降维法,将多维数据降至一维,在一维上利用自适应排序聚类算法ASC聚类。该算法和传统的Cobweb算法、K-means算法做对比,实验表明该方法能提高簇间相似度,最大提高200%。
-
关键词
簇直径
簇间相似度
asc算法
中心距序降维
-
Keywords
cluster diameter
cluster similarity
self-Adaptive Sort Clustering(asc) algorithm
dimension reduction by center distance order
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种倒排索引压缩方法
被引量:6
- 2
-
-
作者
白福均
高建瓴
李宛蓉
贺思云
肖绍武
-
机构
贵州大学大数据与信息工程学院
贵州大学档案馆
-
出处
《计算机应用研究》
CSCD
北大核心
2019年第1期106-109,共4页
-
基金
贵州省档案局科研资助项目(2015D001)
贵州省科学技术基金资助项目(黔科合J字[2015]2045)
+1 种基金
贵州大学研究生创新基金资助项目(研理工2017014
研理工2017016)
-
文摘
针对自适应分段压缩ASCS算法进行了研究,对于ASCS算法中采用的均匀分段方式并非最优分段问题,提出以人工蜂群算法优化ASCS算法中的分段方式;对于ASCS算法考虑序列占用空间的影响因素过于单一问题,提出多因素下的改进算法;对于分布不均的长序列在ASCS算法下压缩率不理想的问题,提出先排序后差分编码操作再以ASCS算法压缩。通过对比实验证明,优化改进后的算法可以较显著地压缩倒排索引。
-
关键词
搜索引擎
倒排索引
索引压缩
人工蜂群算法
ascS算法
-
Keywords
search engine
inverted index
index compression
artificial bee colony
ascS algorithm
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
TP301.6
[自动化与计算机技术—计算机系统结构]
-