期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种基于ReliefF特征加权的R-NIC算法
被引量:
6
1
作者
陈晓琳
姬波
叶阳东
《计算机工程》
CAS
CSCD
北大核心
2015年第4期161-165,共5页
非参数信息理论聚类(NIC)算法通过计算数据点与簇间的互信息来实现聚类,利用无参估计法计算集群平均熵,从而降低人为参与的成本,但该算法假定待分析样本的所有特征对分类具有相同的贡献,与目前已有的研究结果相悖。为此,提出一种特征加...
非参数信息理论聚类(NIC)算法通过计算数据点与簇间的互信息来实现聚类,利用无参估计法计算集群平均熵,从而降低人为参与的成本,但该算法假定待分析样本的所有特征对分类具有相同的贡献,与目前已有的研究结果相悖。为此,提出一种特征加权的R-NIC算法,该算法考虑各维特征对模式分类的不同影响,使用Relief F对特征进行加权变换,抑制冗余特征,加强有效特征,利用NIC算法在变换后的特征空间中进行聚类以提高聚类效果。在UCI数据集上的实验结果表明,该算法具有较高的聚类性能,聚类效果优于NIC算法。
展开更多
关键词
非监督
聚类
互信息
非参数信息理论聚类算法
准确率
特征加权
在线阅读
下载PDF
职称材料
基于信息理论的网络文本组合聚类
2
作者
王扬
袁昆
+2 位作者
刘洪甫
吴俊杰
包秀国
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2016年第8期1603-1611,共9页
尽管近年来针对文本聚类问题进行了大量研究,其仍然是数据挖掘领域的一个富有挑战性的问题,特别在弱相关特征乃至噪声特征的处理上,仍然存在诸多挑战。针对这一问题提出了文本聚类的分解-组合算法框架——DIAS。该方法首先通过简单随机...
尽管近年来针对文本聚类问题进行了大量研究,其仍然是数据挖掘领域的一个富有挑战性的问题,特别在弱相关特征乃至噪声特征的处理上,仍然存在诸多挑战。针对这一问题提出了文本聚类的分解-组合算法框架——DIAS。该方法首先通过简单随机特征抽样将高维文本数据进行分解得到多样化的结构知识,其优点是能够较好地避免产生大量的噪声特征。然后采用基于信息理论的一致性聚类(ICC)将多视角基础聚类知识组合起来,得到高质量的一致性划分。最后通过在8个真实文本数据集上的实验,证明DIAS算法相较于其他被广泛使用的算法具有明显优势,特别在处理弱基础聚类上具有突出效果。由于在分布式计算上的天然优势,DIAS有望成为大规模文本聚类的主流算法。
展开更多
关键词
文本聚类
分解-组合算法
基于信息理论的一致性聚类
K-均值
大数据聚类
在线阅读
下载PDF
职称材料
题名
一种基于ReliefF特征加权的R-NIC算法
被引量:
6
1
作者
陈晓琳
姬波
叶阳东
机构
郑州大学信息工程学院
出处
《计算机工程》
CAS
CSCD
北大核心
2015年第4期161-165,共5页
基金
国家自然科学基金资助项目"多变量IB方法及算法的研究"(61170223)
国家自然科学基金联合基金资助项目"可扩展迁移学习中跨媒体复杂问题自动映射研究"(U1204610)
文摘
非参数信息理论聚类(NIC)算法通过计算数据点与簇间的互信息来实现聚类,利用无参估计法计算集群平均熵,从而降低人为参与的成本,但该算法假定待分析样本的所有特征对分类具有相同的贡献,与目前已有的研究结果相悖。为此,提出一种特征加权的R-NIC算法,该算法考虑各维特征对模式分类的不同影响,使用Relief F对特征进行加权变换,抑制冗余特征,加强有效特征,利用NIC算法在变换后的特征空间中进行聚类以提高聚类效果。在UCI数据集上的实验结果表明,该算法具有较高的聚类性能,聚类效果优于NIC算法。
关键词
非监督
聚类
互信息
非参数信息理论聚类算法
准确率
特征加权
Keywords
unsupervised
clustering
mutual
information
nonparametric information theoretic clustering(nic) algorithm
accuracy
feature w eighting
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于信息理论的网络文本组合聚类
2
作者
王扬
袁昆
刘洪甫
吴俊杰
包秀国
机构
北京航空航天大学经济管理学院
北京航空航天大学机械工程及自动化学院
东北大学工学院
国家计算机网络与信息安全管理中心
出处
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2016年第8期1603-1611,共9页
基金
国家自然科学基金(71531001
71322104
+3 种基金
71171007
71471009)
国家"863"计划(SS2014AA012303)
中央高校基本科研业务费专项资金~~
文摘
尽管近年来针对文本聚类问题进行了大量研究,其仍然是数据挖掘领域的一个富有挑战性的问题,特别在弱相关特征乃至噪声特征的处理上,仍然存在诸多挑战。针对这一问题提出了文本聚类的分解-组合算法框架——DIAS。该方法首先通过简单随机特征抽样将高维文本数据进行分解得到多样化的结构知识,其优点是能够较好地避免产生大量的噪声特征。然后采用基于信息理论的一致性聚类(ICC)将多视角基础聚类知识组合起来,得到高质量的一致性划分。最后通过在8个真实文本数据集上的实验,证明DIAS算法相较于其他被广泛使用的算法具有明显优势,特别在处理弱基础聚类上具有突出效果。由于在分布式计算上的天然优势,DIAS有望成为大规模文本聚类的主流算法。
关键词
文本聚类
分解-组合算法
基于信息理论的一致性聚类
K-均值
大数据聚类
Keywords
text
clustering
disassemble-assemble
algorithm
information
-
theoretic
consensus
clustering
K-means
big data
clustering
分类号
V221.3 [航空宇航科学与技术—飞行器设计]
TB553 [理学—声学]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种基于ReliefF特征加权的R-NIC算法
陈晓琳
姬波
叶阳东
《计算机工程》
CAS
CSCD
北大核心
2015
6
在线阅读
下载PDF
职称材料
2
基于信息理论的网络文本组合聚类
王扬
袁昆
刘洪甫
吴俊杰
包秀国
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2016
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部