-
题名基于类别分布特征的快速文本分类方法
被引量:3
- 1
-
-
作者
杨林波
王士同
-
机构
江南大学信息工程学院
江南大学创新多媒体中心
-
出处
《计算机工程与设计》
CSCD
北大核心
2009年第5期1267-1269,1281,共4页
-
基金
教育部科学技术重点研究项目(105087)。
-
文摘
中心和边界是类别分布的重要特征。利用训练样本类别分布特征,提出了一种基于类别分布特征的快速文本分类算法。依据类别分布特征调整文本与类别的相似度,克服了数据集类别间样本分布不均衡和类别中样本密度不均的缺点,提高分类的性能。实验结果表明,该算法提高了文本分类的效果,显示出了较好的鲁棒性,并显著提高了文本分类效率。
-
关键词
文本挖掘
文本分类
分布特征
快速分类
信息检索
-
Keywords
text mining
text categorization
distribution character
fast categorization
information retrieval
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于边界可信度相似的快速文本分类方法
被引量:3
- 2
-
-
作者
杨林波
王士同
-
机构
江南大学信息工程学院
江南大学创新多媒体中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第4期156-158,201,共4页
-
基金
国家教育部科学技术重点研究项目No.105087~~
-
文摘
类别的中心和边界是类别的重要特征.利用训练样本的中心和边界作为分类准则,提出了一种基于边界可信度相似的快速文本分类算法。通过类别边界可信度调整文本与类别的相似性,克服了数据集类别间样本分布不均衡和类别中样本密度不均的缺点,提高了分类性能。实验结果表明该算法提高了文本分类的效果,显示出了较好的鲁棒性,并显著提高了文本分类效率。
-
关键词
文本分类
相似度
快速分类
-
Keywords
text categorization
similarity
fast categorization
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于归一化割的自适应多阈值图像分割方法
被引量:4
- 3
-
-
作者
朱友勇
王士同
-
机构
江南大学信息工程学院
江南大学创新多媒体中心
-
出处
《计算机工程与设计》
CSCD
北大核心
2009年第9期2217-2221,2228,共6页
-
基金
教育部科学技术重点研究基金项目(105087)
-
文摘
基于图谱理论的图像阈值分割方法是一种基于全局的单阈值分割方法,其对复杂图像的分割效果不明显,而且其采用的权值计算公式中含有两个需手动调整的参数,这些都限制了该算法的通用性。据此提出基于归一化割的自适应多阈值图像分割方法,它通过几个阈值来分割复杂图像,并且采用了一个自适应权值计算公式,提高了该方法的通用性。大量的实验结果表明该方法具有很好的分割效果,可以保留更多的图像细节。
-
关键词
归一化割准则
多阈值
图像分割
势函数
势函数聚类
-
Keywords
normalized cuts
multi thresholds
image segmentation
potential function
potential function clustering
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-