期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于语义串抽取及主题相似度度量的维吾尔文文本分类
被引量:
4
1
作者
吐尔地.托合提
维尼拉.木沙江
艾斯卡尔.艾木都拉
《中文信息学报》
CSCD
北大核心
2017年第4期100-107,共8页
该文研究一种改进的n元递增算法来抽取维吾尔文本中表达关键信息的语义串,并用带权语义串集来刻画文本主题,提出了一种类似于Jaccard相似度的文本和类主题相似度度量方法,并实现了相应的维吾尔文分类算法。实验结果表明,该文提出的文本...
该文研究一种改进的n元递增算法来抽取维吾尔文本中表达关键信息的语义串,并用带权语义串集来刻画文本主题,提出了一种类似于Jaccard相似度的文本和类主题相似度度量方法,并实现了相应的维吾尔文分类算法。实验结果表明,该文提出的文本模型简单有效,分类算法计算量不高,而且还能达到或超过经典分类器的分类综合性能。
展开更多
关键词
维吾尔文
n元递增算法
语义串抽取
主题相似度
文本分类
在线阅读
下载PDF
职称材料
基于购物网站用户搜索日志的商品词发现
被引量:
3
2
作者
杨锦锋
吕新波
+1 位作者
关毅
周春波
《计算机应用与软件》
CSCD
2011年第11期108-111,160,共5页
商品词是电子商务领域描述商品的新词。主要介绍基于购物网站用户搜索日志的商品词发现的方法。该方法从搜索日志中提取用户查询,对查询进行分词,采用N元递增分步算法和串频统计,计算候选串的条件概率,选择候选商品词。为了降低人工审...
商品词是电子商务领域描述商品的新词。主要介绍基于购物网站用户搜索日志的商品词发现的方法。该方法从搜索日志中提取用户查询,对查询进行分词,采用N元递增分步算法和串频统计,计算候选串的条件概率,选择候选商品词。为了降低人工审核的成本,只对产出商品词的准确率进行评价。利用该方法在手机、面霜和香水三类商品的搜索日志上进行了实验,最高准确率达到92.58%。
展开更多
关键词
商品词
新词发现
n
元
递增
分步
算法
串频统计
在线阅读
下载PDF
职称材料
题名
基于语义串抽取及主题相似度度量的维吾尔文文本分类
被引量:
4
1
作者
吐尔地.托合提
维尼拉.木沙江
艾斯卡尔.艾木都拉
机构
新疆大学信息科学与工程学院
出处
《中文信息学报》
CSCD
北大核心
2017年第4期100-107,共8页
基金
国家自然科学基金(61562083
61262062
+1 种基金
61262063)
新疆维吾尔自治区高校科研计划重点项目(XJEDU2012I11)
文摘
该文研究一种改进的n元递增算法来抽取维吾尔文本中表达关键信息的语义串,并用带权语义串集来刻画文本主题,提出了一种类似于Jaccard相似度的文本和类主题相似度度量方法,并实现了相应的维吾尔文分类算法。实验结果表明,该文提出的文本模型简单有效,分类算法计算量不高,而且还能达到或超过经典分类器的分类综合性能。
关键词
维吾尔文
n元递增算法
语义串抽取
主题相似度
文本分类
Keywords
Uyghur la
n
guage
freque
n
t patter
n
-growth algorithm
sema
n
tic stri
n
g extractio
n
topic similarity
text classificatio
n
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于购物网站用户搜索日志的商品词发现
被引量:
3
2
作者
杨锦锋
吕新波
关毅
周春波
机构
哈尔滨工业大学计算机科学与技术学院
出处
《计算机应用与软件》
CSCD
2011年第11期108-111,160,共5页
基金
国家自然科学基金项目(60975077
60736044)
文摘
商品词是电子商务领域描述商品的新词。主要介绍基于购物网站用户搜索日志的商品词发现的方法。该方法从搜索日志中提取用户查询,对查询进行分词,采用N元递增分步算法和串频统计,计算候选串的条件概率,选择候选商品词。为了降低人工审核的成本,只对产出商品词的准确率进行评价。利用该方法在手机、面霜和香水三类商品的搜索日志上进行了实验,最高准确率达到92.58%。
关键词
商品词
新词发现
n
元
递增
分步
算法
串频统计
Keywords
Commodity words
n
ew words detectio
n
n
-gram i
n
creasi
n
g algorithm Stri
n
g freque
n
cy statistics
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于语义串抽取及主题相似度度量的维吾尔文文本分类
吐尔地.托合提
维尼拉.木沙江
艾斯卡尔.艾木都拉
《中文信息学报》
CSCD
北大核心
2017
4
在线阅读
下载PDF
职称材料
2
基于购物网站用户搜索日志的商品词发现
杨锦锋
吕新波
关毅
周春波
《计算机应用与软件》
CSCD
2011
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部