-
题名用平滑方法改进多关系朴素贝叶斯分类
被引量:9
- 1
-
-
作者
徐光美
刘宏哲
张敬尊
王金华
-
机构
北京联合大学信息学院
北京联合大学信息服务工程重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2017年第5期69-72,共4页
-
基金
国家自然科学基金(No.61372148
No.61202245)
+2 种基金
北京市"长城学者"计划项目(No.CIT&TCD20130320)
北京市优秀人才培养项目(No.2010D005022000011)
北京联合大学自然科学项目(No.zk20201403)
-
文摘
为消除朴素贝叶斯分类时的零概率以及过度拟合问题,分析了各种概率平滑方法,给出了基于M估计的多关系朴素贝叶斯分类方法(MRNBC-M)和基于Laplace估计的多关系朴素贝叶斯分类方法(MRNBC-L),分析探讨了M平滑和Laplace平滑方法对多关系分类的影响情况,为进一步优化分类,方法基于扩展互信息标准对数据进行属性过滤。多关系标准数据集上的实验显示,MRNBC-M可以有效改进分类性能。
-
关键词
多关系数据挖掘
朴素贝叶斯
参数平滑
互信息
-
Keywords
multi-relational data mining(mrdm)
Naive Bayes
smoothing methods
mutual information
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于特征加权的多关系朴素贝叶斯分类模型
被引量:12
- 2
-
-
作者
徐光美
刘宏哲
张敬尊
-
机构
北京联合大学信息服务工程重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2014年第10期283-285,共3页
-
基金
国家自然科学基金(61372148)
北京市"长城学者"计划项目(CIT&TCD20130320)
+1 种基金
北京市优秀人才培养(2010D005022000011)
北京联合大学校级科研项目(zk201017x)资助
-
文摘
为进一步提高多关系朴素贝叶斯方法的分类准确率,分析了已有的特征加权方法,并在将特征加权方法扩展到多关系的情况下结合元组ID传播方法和面向元组的统计计数方法,建立了基于特征加权的多关系朴素贝叶斯分类模型(MRNBC-W)。标准数据集上的实验结果显示,新方法可以在不增加算法时间复杂度的前提下,有效提高金融数据集的分类准确率。文中也给出了结合扩展互信息标准对属性进行过滤后,加权方法和不加权方法的分类比较。
-
关键词
多关系数据挖掘
朴素贝叶斯
分类
互信息
特征加权
-
Keywords
multi-relational data mining (mrdm), Naive Bayes, Classification, Mutual information, Feature weighting
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名多关系数据挖掘方法研究
被引量:5
- 3
-
-
作者
徐光美
杨炳儒
张伟
宁淑荣
-
机构
北京科技大学信息工程学院知识工程研究所
-
出处
《计算机应用研究》
CSCD
北大核心
2006年第9期8-12,共5页
-
基金
国家科技成果重点推广计划项目(2003EC000001)
-
文摘
目前大多数数据挖掘方法是从单关系中发现模式,而多关系数据挖掘(MRDM)则可直接从关系数据库的多表中抽取有效模式。MRDM可以解决原有命题数据挖掘方法不能解决的问题,它不仅有更强的信息表示能力,可以表示和发现更复杂的模式,还可以在挖掘进程中有效地利用背景知识来提高挖掘效率和准确率。近年来,借鉴归纳逻辑程序设计(ILP)技术,已经形成许多多关系数据挖掘方法,如关系关联规则挖掘方法、关系分类聚类方法等。
-
关键词
多关系数据挖掘(关系数据挖掘)
归纳逻辑程序设计
关系分类回归
关系关联规则
基于距离的关系方法
-
Keywords
multi-relational data mining(mrdm) ( Relational data mining, RDM)
Inductive Logic Programming (ILP)
Relational Classification and Regression
Relational Association Rules
Relational Distance-based Methods
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种新的多关系朴素贝叶斯分类器
被引量:4
- 4
-
-
作者
徐光美
杨炳儒
秦奕青
-
机构
北京科技大学信息工程学院知识工程研究所
-
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2008年第4期655-657,共3页
-
基金
国家自然科学基金资助课题(60675030)
-
文摘
针对现有多关系朴素贝叶斯分类器中存在的统计偏斜问题,扩展了语义关系图的定义,给出了一种新的统计计数方法,构建了相应得多关系朴素贝叶斯分类公式,形成了一种基于关系数据库技术的新的多关系朴素贝叶斯分类器。为高效进行关系表连接,采用元组ID传播方法对关系表进行虚拟连接。进一步提高分类准确率,基于互信息标准对属性进行剪枝。实验显示新的分类器具有良好的分类性能。
-
关键词
多关系数据挖掘
朴素贝叶斯
语义关系图
分类
关系数据库
-
Keywords
multi-relational data mining(mrdm)
naive Bayes
semantic relationship graph(SRG)
classi- fication
relational database
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名多关系关联规则算法综述
被引量:3
- 5
-
-
作者
侯伟
杨炳儒
宋威
-
机构
北京科技大学信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2007年第23期1-5,共5页
-
基金
国家自然科学基金(the National Natural Science Foundation of China under Grant No.60675030)
-
文摘
多关系数据挖掘是借鉴ILP技术,并结合机器学习方法所提出的数据挖掘新课题。多关系关联规则是多关系方法在概念描述任务中最具代表性的研究方向之一,此类方法在发挥多关系方法的模式表达能力与利用背景知识能力的同时,借鉴成熟的关联规则方法的思想与优化策略,取得了较高的性能与表达复杂模式的能力,同时在面向复杂结构数据的应用中获得了较好的效果。在简述多关系方法的基础上,通过分析与比较目前具有代表性的多关系关联规则算法,总结了各算法的优势与不足,并指出了该领域目前的主要热点问题。
-
关键词
归纳逻辑程序设计
多关系数据挖掘
多关系关联规则
-
Keywords
Inductive Logic Programming(ILP)
multi-relational data mining(mrdm)
multi-relational Association Rules(MRAR)
-
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
-
-
题名多关系决策树学习算法的研究与改进
被引量:1
- 6
-
-
作者
谢志强
于旭
杨静
刘若铎
-
机构
哈尔滨理工大学计算机科学与技术学院
哈尔滨工程大学计算机科学与技术学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第8期50-52,共3页
-
基金
国家自然科学基金资助项目(60673131,60873019)
黑龙江省自然科学基金资助项目(F200608)
+1 种基金
黑龙江省海外学人重大科研基金资助项目(1152hq08)
哈尔滨理工大学创新基金资助项目
-
文摘
通过对多关系决策树学习算法MRDTL-2进行研究与分析,针对其运行效率较低和不能有效处理丢失属性值的问题,提出一种改进的多关系数据挖掘(IMRDTL)算法。在IMRDTL算法中,利用元组ID传播技术来进一步提高MRDTL-2算法的运行效率,同时使用广义朴素贝叶斯分类器来填补丢失的属性值,以进一步提高算法的准确率。
-
关键词
多关系数据挖掘
决策树
元组ID传播
广义朴素贝叶斯
-
Keywords
multi-relational data mining(mrdm)
decision tree
tuple ID propagation
generalized naive Bayes
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名多关系数据分类方法综述
被引量:1
- 7
-
-
作者
彭珍
杨炳儒
李冬艳
侯伟
宁顶利
-
机构
北京科技大学信息工程学院知识工程研究所
华北科技学院计算机系
-
出处
《计算机工程与应用》
CSCD
北大核心
2008年第34期35-39,共5页
-
基金
国家自然科学基金No.60675030~~
-
文摘
多关系数据分类是多关系数据挖掘重要任务之一,它能够直接从多关系数据表中发现有效模式,比命题分类方法具有更大优势。根据知识表示形式及相关策略的不同将多关系数据分类分为归纳逻辑程序设计关系分类方法、图的关系分类方法和基于关系数据库的关系分类方法。着重论述了它们所采用的具体关系分类技术及其特点,对这些方法进行了对比,最后讨论了它们当前所面临的挑战性问题。
-
关键词
多关系数据挖掘
关系分类
归纳逻辑程序设计
图
选择图
元组标识传播
-
Keywords
multi-relational data mining ( mrdm )
relational classification
Inductive Logic Programming (ILP)
graph
selection graph
tuple ID propagation
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名多关系数据挖掘研究综述
被引量:4
- 8
-
-
作者
张伟
杨炳儒
宋威
-
机构
北京科技大学信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第2期1-6,共6页
-
基金
国家科技成果重点推广计划资助项目(编号:2003EC000001)
-
文摘
多关系数据挖掘是近年来快速发展的重要的数据挖掘领域之一。传统的数据挖掘方法只能完成单一关系中的模式发现,多关系数据挖掘能够从复杂结构化数据中发现涉及多个关系的复杂模式。该文综述了多关系数据挖掘的研究状况。首先分析了多关系数据挖掘领域发生的原因和背景,其次总结了多关系数据挖掘研究的一般方法,然后介绍、分析了最具代表性的多关系数据挖掘算法。最后,总结了多关系数据挖掘将来发展需重点解决的问题和面临的挑战。
-
关键词
多关系数据挖
掘归纳逻辑程序设计
多关系决策树
关系距离测度
多关系关联规则
统计关系学习
-
Keywords
multi-relational data mining (mrdm), Inductive Logic Programming (ILP), muhi-relational decision trees, relational distance measure, multi-relational association rules, Statistical Relational Learning(SRL)
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名朴素贝叶斯分类器一阶扩展的注记
被引量:1
- 9
-
-
作者
徐光美
杨炳儒
钱榕
-
机构
北京科技大学信息工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第13期49-50,53,共3页
-
基金
国家自然科学基金资助项目(60675030)
-
文摘
众多研究者致力于将朴素贝叶斯方法与原有的ILP系统结合,形成各种各样的多关系朴素贝叶斯分类器(MRNBC)。该文提出形成朴素贝叶斯分类器的一阶扩展的一般方法。现实中关系数据库广泛存在,可以直接作用于数据库表,而无须转换表示形式的MRNBC则是研究的重点,该方法主要基于关系数据库理论,分析了进行一阶扩展的关键问题。
-
关键词
多关系数据挖掘
朴素贝叶斯
分类
归纳逻辑程序设计
关系数据库
-
Keywords
multi-relational data mining(mrdm)
Naive Bayesian
classification
Inductive Logic Programming(ILP)
relational database
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种有效率的基于图的关系学习算法
- 10
-
-
作者
郑丽珍
郭景峰
李晶
边伟峰
-
机构
燕山大学信息科学与工程学院
河北工业大学电气与自动化学院
-
出处
《计算机科学》
CSCD
北大核心
2008年第3期161-163,共3页
-
基金
国家自然科学基金项目(编号:60673136)
-
文摘
多关系数据挖掘根据表示形式可以分为基于图的MRDM和基于逻辑的MRDM。本文讨论了基于图的数据挖掘和基于图的关系学习之间的关系,重点介绍基于图的关系学习算法Subdue及其优缺点,针对它的缺点提出优化的算法ESubdue,改进了子图同构的计算,减少了子图同构的次数。在实际和人工数据集上运行的实验结果显示它比原算法更加有效率。最后给出结论并指明将来的工作。
-
关键词
多关系数据挖掘
基于逻辑的mrdm
基于图的mrdm
Subdue
-
Keywords
multi-relational data mining, Logic-based mrdm, Graph-based mrdm, Subdue
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
TP391.2
[自动化与计算机技术—计算机应用技术]
-