期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于TextRank算法和互信息相似度的维吾尔文关键词提取及文本分类
被引量:
9
1
作者
阿力甫.阿不都克里木
李晓
《计算机科学》
CSCD
北大核心
2016年第12期36-40,共5页
针对维吾尔语文本的分类问题,提出一种基于TextRank算法和互信息相似度的维吾尔文关键词提取及文本分类方法。首先,对输入文本进行预处理,滤除非维吾尔语的字符和停用词;然后,利用词语语义相似度、词语位置和词频重要性加权的TextRank...
针对维吾尔语文本的分类问题,提出一种基于TextRank算法和互信息相似度的维吾尔文关键词提取及文本分类方法。首先,对输入文本进行预处理,滤除非维吾尔语的字符和停用词;然后,利用词语语义相似度、词语位置和词频重要性加权的TextRank算法提取文本关键词集合;最后,根据互信息相似度度量,计算输入文本关键词集和各类关键词集的相似度,最终实现文本的分类。实验结果表明,该方案能够提取出具有较高识别度的关键词,当关键词集大小为1250时,平均分类率达到了91.2%。
展开更多
关键词
维吾尔语
文本分类
关键词提取
TextRank算法
互信息相似度
在线阅读
下载PDF
职称材料
题名
基于TextRank算法和互信息相似度的维吾尔文关键词提取及文本分类
被引量:
9
1
作者
阿力甫.阿不都克里木
李晓
机构
中国科学院新疆理化技术研究所
中国科学院大学
新疆多语种信息技术重点实验室
出处
《计算机科学》
CSCD
北大核心
2016年第12期36-40,共5页
基金
新疆多语种信息技术重点实验室开放课题(XJDX0905-2013-06)资助
文摘
针对维吾尔语文本的分类问题,提出一种基于TextRank算法和互信息相似度的维吾尔文关键词提取及文本分类方法。首先,对输入文本进行预处理,滤除非维吾尔语的字符和停用词;然后,利用词语语义相似度、词语位置和词频重要性加权的TextRank算法提取文本关键词集合;最后,根据互信息相似度度量,计算输入文本关键词集和各类关键词集的相似度,最终实现文本的分类。实验结果表明,该方案能够提取出具有较高识别度的关键词,当关键词集大小为1250时,平均分类率达到了91.2%。
关键词
维吾尔语
文本分类
关键词提取
TextRank算法
互信息相似度
Keywords
Uyghur language, Text categorization, Keyword extraction, TextRank algorithm, Mutual information similarity
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于TextRank算法和互信息相似度的维吾尔文关键词提取及文本分类
阿力甫.阿不都克里木
李晓
《计算机科学》
CSCD
北大核心
2016
9
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部