期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于概念语义相关性和LDA的文本标记算法 被引量:1
1
作者 周春 蒋运承 《华南师范大学学报(自然科学版)》 CAS 北大核心 2018年第4期121-128,共8页
为了提高文本标记和分类的效率,提出了基于概念语义相关性和LDA的文本自动标记算法(Text Mark Label,TML),用以代替人工标记的文本分类标记.该算法在概念语义相关性计算的基础上,使用LDA(Latent Dirichlet Allocation)提取文本的主题表... 为了提高文本标记和分类的效率,提出了基于概念语义相关性和LDA的文本自动标记算法(Text Mark Label,TML),用以代替人工标记的文本分类标记.该算法在概念语义相关性计算的基础上,使用LDA(Latent Dirichlet Allocation)提取文本的主题表示,通过计算文本主题从属于各分类目录的期望从而实现文本自动标记.为验证TML算法的效果,在标准文本分类数据集上使用文本分类器进行有监督文本分类实验.为对比数据集和分类器对分类效果的影响,在3个数据集(WebKB、Reuters-21578、20-News Group)上分别使用3种不同的分类器(Rocchio、KNN、SVM)进行实验.实验结果表明:TML算法有效地提高了文本分类效率及文本标记效率. 展开更多
关键词 概念语义相关性 相似度计算 文本标记 主题模型 文本分类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部