期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于语义串抽取及主题相似度度量的维吾尔文文本分类 被引量:4
1
作者 吐尔地.托合提 维尼拉.木沙江 艾斯卡尔.艾木都拉 《中文信息学报》 CSCD 北大核心 2017年第4期100-107,共8页
该文研究一种改进的n元递增算法来抽取维吾尔文本中表达关键信息的语义串,并用带权语义串集来刻画文本主题,提出了一种类似于Jaccard相似度的文本和类主题相似度度量方法,并实现了相应的维吾尔文分类算法。实验结果表明,该文提出的文本... 该文研究一种改进的n元递增算法来抽取维吾尔文本中表达关键信息的语义串,并用带权语义串集来刻画文本主题,提出了一种类似于Jaccard相似度的文本和类主题相似度度量方法,并实现了相应的维吾尔文分类算法。实验结果表明,该文提出的文本模型简单有效,分类算法计算量不高,而且还能达到或超过经典分类器的分类综合性能。 展开更多
关键词 维吾尔文 n元递增算法 语义串抽取 主题相似度 文本分类
在线阅读 下载PDF
基于购物网站用户搜索日志的商品词发现 被引量:3
2
作者 杨锦锋 吕新波 +1 位作者 关毅 周春波 《计算机应用与软件》 CSCD 2011年第11期108-111,160,共5页
商品词是电子商务领域描述商品的新词。主要介绍基于购物网站用户搜索日志的商品词发现的方法。该方法从搜索日志中提取用户查询,对查询进行分词,采用N元递增分步算法和串频统计,计算候选串的条件概率,选择候选商品词。为了降低人工审... 商品词是电子商务领域描述商品的新词。主要介绍基于购物网站用户搜索日志的商品词发现的方法。该方法从搜索日志中提取用户查询,对查询进行分词,采用N元递增分步算法和串频统计,计算候选串的条件概率,选择候选商品词。为了降低人工审核的成本,只对产出商品词的准确率进行评价。利用该方法在手机、面霜和香水三类商品的搜索日志上进行了实验,最高准确率达到92.58%。 展开更多
关键词 商品词 新词发现 n递增分步算法 串频统计
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部