题名 基于属性依赖关系和对象相关性的自然聚类算法
被引量:1
1
作者
王全蕊
王建平
机构
河南科技学院信息工程学院
武汉理工大学信息工程学院
出处
《小型微型计算机系统》
CSCD
北大核心
2015年第4期810-814,共5页
基金
国家自然科学基金项目(61272109)资助
文摘
针对数据集中属性间存在依赖关系以及对象间存在相关性,定义了一种新的相似关系模型,该模型所描述的相似关系能够体现对象之间的自然相关性.在此基础上提出一种基于属性依赖关系和对象相关性的自然聚类算法,该聚类算法在不事先指定聚类数目的情况下,将所有相似性达到设定阈值的对象自然聚为一类;当调整相似性阈值时,该算法还可实现不同粒度的聚类.通过分别对数值型数据集和分类型数据集进行实验比较分析,结果表明这种自然聚类算法与其他聚类算法相比,能够真实反映数据间的相关性以及数据集的自然簇结构,同时可以发现任意形状的簇,有效地提高了聚类的精度和质量.
关键词
属性 依赖关系
对象 相关性
相似度
目标函数
自然聚 类
Keywords
attribute dependency
object correlation
similarity
object function
natural clustering
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 改进的CSFCM聚类算法及其在赤潮监测中的应用
被引量:4
2
作者
王兴强
刘长兴
刘国伟
张旭东
机构
济南军区总医院信息科
中国人民解放军
出处
《计算机工程与应用》
CSCD
2012年第8期233-235,245,共4页
基金
山东省科技攻关计划(No.2004GG2205108)
文摘
为满足海洋监测系统中赤潮监测数据的信息挖掘需求,在深入探讨数据挖掘相关算法的基础上,提出一种新的基于分组属性加权聚类的CSFCM算法。该算法将COSA(Clustering Objects on Subsets of Attributes)算法与模糊C均值算法相结合并引入相似关系预处理,再对准则函数和聚类模型加以改进。实验结果表明,该算法适用于赤潮监测数据挖掘的实时聚类需求,准确率高,为赤潮预报提供必要的决策依据。
关键词
赤潮监测
属性 子集的 聚 类 对象 (cosa )
聚 类
Keywords
red tide monitoring
Clustering Objects on Subsets of Attributes (cosa )
clustering
分类号
TP301
[自动化与计算机技术—计算机系统结构]
题名 双类型异质网中基于排序和聚类的离群点检测方法
被引量:6
3
作者
彭涛
杨妮亚
徐原博
王冰冰
刘露
机构
吉林大学计算机科学与技术学院
符号计算与知识工程教育部重点实验室(吉林大学)
出处
《电子学报》
EI
CAS
CSCD
北大核心
2018年第2期281-288,共8页
基金
国家自然科学基金(No.60903098)
吉林大学研究生创新基金(No.2016183
No.2016184)
文摘
挖掘隐藏在网络中不同于正常数据对象的离群点是数据挖掘的重要任务之一.目前,针对双类型异质信息网络离群点检测的研究工作相对较少,原本适用于同质网络的离群点检测方法将很难适用于双类型异质网络.为此,提出了异质信息网络中基于排序和聚类的离群点检测方法(RKBOutlier).从异质信息网络中抽取两种类型的对象以及链接两种对象的语义信息,将待检测的数据作为属性对象,将另一类型数据作为目标对象,对目标对象进行聚类来检测属性对象在各个聚类中的分布情况,数据分布异常的对象即为离群点.将排序和聚类相结合来显著提高聚类的准确度.实验结果表明,RKBOutlier可以在双类型异质信息网络中有效地检测出离群点.
关键词
离群点检测
排序
聚 类
目标对象
属性 对象
Keywords
outlier detection
ranking
clustering
target object
attribute object
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于覆盖粗糙集模型的层次聚类算法
被引量:2
4
作者
龚科华
邱桃荣
熊树洁
徐苏
机构
南昌大学计算机系
出处
《计算机工程与设计》
CSCD
北大核心
2009年第22期5185-5188,共4页
基金
江西省重点攻关基金项目(20061B01002)
江西省教育厅科技基金项目([2007]28)
文摘
目前大部分聚类算法只适用于处理属性取值为单值的数值型数据,介绍了一种新的基于粗糙集理论的聚类算法,该算法不仅可用于取值为单值的数值型数据聚类,而且能够用于取值为多值的非数值型数据聚类。该算法利用基于相容关系的属性最小覆盖来求解对象各属性的对象属性信息粒。在此基础上,通过对象属性信息粒和对象粗糙相似度的运算构建各对象的相容粒。最后,把具有相同相容粒的对象视为同一等价类,从而实现对论域的聚类,进而对数据对象进行层次聚类。实验结果表明,该算法是可行的。
关键词
粗糙集
聚 类
相容粒
对象 属性 信息粒
最小覆盖
Keywords
rough set
clustering
tolerance granulation
object attribute information granulation
minimum cover
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 面向特定领域的产品评价对象自动识别研究
被引量:34
5
作者
宋晓雷
王素格
李红霞
机构
山西大学数学科学学院
山西大学计算智能与中文信息处理教育部重点实验室
出处
《中文信息学报》
CSCD
北大核心
2010年第1期89-93,共5页
基金
国家自然科学基金资助项目(60875040
60970014)
+4 种基金
教育部高等学校博士点基金资助项目(200801080006)
山西省自然科学基金资助项目(2007011042)
教育部科学技术研究重点基金资助项目(2007018)
山西省重点实验室开放基金资助项目(2007031017)
太原市科技局明星专项(09121001)
文摘
产品评价对象的自动识别是文本观点信息抽取和倾向性分析中的重要研究课题之一。该文针对汽车评论,提出了一种不依赖外部资源的无指导评价对象自动识别方法。该方法首先综合使用词形模板和词性模板,采用模糊匹配方法和剪枝法抽取候选评价对象。然后,从候选对象集中,采用双向Bootstrapping方法识别出产品评价对象。最后,通过采用K均值聚类方法对产品评价对象进行聚类,实现从评价对象中自动抽取产品名称和产品属性。实验结果表明,该方法对产品评价对象识别的F值达到58.5%,产品名称识别的F值达到69.48%。
关键词
计算机应用
中文信息处理
产品评价对象
产品名称
产品属性
模板
K均值聚 类
双向Bootstrapping方法
Keywords
computer application
Chinese information processing
comment target of product
product name
prod uct attribute
template
K-means clustering
bidirectional Bootstrapping
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 两种多粒度形式概念分析模型的比较研究
被引量:2
6
作者
折延宏
胡梦婷
贺晓丽
曾望林
机构
西安石油大学理学院
西安石油大学计算机学院
出处
《计算机工程与应用》
CSCD
北大核心
2020年第10期51-55,共5页
基金
国家自然科学基金(No.61976244,No.61472471)
陕西省创新人才推进计划-青年科技新星项目(No.2017KJXX60)
陕西省教育厅科研计划项目(No.18JK0625)。
文摘
多粒度形式概念分析是近年来形式概念分析领域的一个热点方向。基于属性聚类与属性粒化是两种典型的方法。围绕Wille形式概念分析模型以及面向对象概念分析模型对这两种方法进行了深入的对比研究。首先引入了基于属性聚类的Wille概念分析模型,证明了已有的基于属性粒化的形式概念分析模型是该模型的一种特殊情形。将已有的基于属性粒化的面向对象概念分析模型拓展至基于属性聚类的情形,研究了聚类前后外延集的变化规律,证明了聚类前后外延集仍然保持不变的充分必要条件,所得结果进一步推广了已有文献中的结论。
关键词
属性 粒化
属性 聚 类
Wille概念格
面向对象 概念格
Keywords
attribute granulation
attribute clustering
Wille concept lattice
object-oriented concept lattice
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]