-
题名词间相关性在贝叶斯文本分类中的应用研究
被引量:4
- 1
-
-
作者
章舜仲
王树梅
黄河燕
陈肇雄
-
机构
南京理工大学计算机科学系
南京财经大学电子商务系
中国科学院计算机语言信息工程研究中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第16期159-161,共3页
-
文摘
针对朴素贝叶斯分类的属性独立性假设的不足,讨论了相关性及多变量相关的概念,给出词间相关度的定义。在TAN分类器的词间相关性分析基础上,提出一种文档特征词相关度估计公式及其在改进朴素贝叶斯分类模型中应用的算法,在Reuters-21578文本数据集上的实验表明,改进算法简单易行,能有效改进贝叶斯分类性能。
-
关键词
文本分类
朴素贝叶斯
事件相关
相关度
树扩展型朴素贝叶斯分类器
-
Keywords
text classification
Naive Bayes
event correlation
correlation degree
Tree Augmented Naive Bayes(TAN) classifier
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于有向树算法构造的TAN分类器
被引量:1
- 2
-
-
作者
王学玲
王志海
王建林
-
机构
滨州学院计算机科学技术系
北京交通大学计算机与信息技术学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2008年第13期3451-3453,共3页
-
文摘
树扩展型朴素贝叶斯(TAN)分类器放松了朴素贝叶斯的属性独立性假设,是对朴素贝叶斯分类器的有效改进。但传统TAN的构造算法中树的根结点是随意选择的,这使得其无法精确表达属性间的依赖关系。通过将依赖关系设定方向,并将有向树算法引入TAN分类器的构造,提出了一种新的TAN模型构造方法——DTAN。实验结果表明,DTAN分类方法在实例个数比较多的数据集上具有显著优秀的分类性能。
-
关键词
朴素贝叶斯
分类器
树扩展型朴素贝叶斯
有向树
依赖关系
-
Keywords
Naive Bayes
classifier
tree augmented Naive Bayes
directed tree
dependence
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-