期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于互信息的维吾尔文自适应组词算法
被引量:
6
1
作者
吐尔地.托合提
艾克白尔.帕塔尔
艾斯卡尔.艾木都拉
《计算机应用研究》
CSCD
北大核心
2013年第2期429-431,435,共4页
传统的分词方法将一个维吾尔文语义词(多词关联模式)拆分成与词意义不符的若干个片段,因此在维吾尔语文本分析及文本处理过程中导致许多问题,严重影响文本处理效率。提出了一种维吾尔文组词的全新概念,用互信息作为相邻单词间关联程度...
传统的分词方法将一个维吾尔文语义词(多词关联模式)拆分成与词意义不符的若干个片段,因此在维吾尔语文本分析及文本处理过程中导致许多问题,严重影响文本处理效率。提出了一种维吾尔文组词的全新概念,用互信息作为相邻单词间关联程度的度量,实现了基于分段式策略和增量式策略的两种自适应组词算法,并与传统的分词方法得到的词汇表进行对比分析。实验结果表明,组词算法能够非常有效地提取文本中的语义词,两种算法在大规模文本集上的组词准确率分别达到了84.31%和88.24%。
展开更多
关键词
维吾尔文
传统分词
语义词
互信息
组词
在线阅读
下载PDF
职称材料
题名
基于互信息的维吾尔文自适应组词算法
被引量:
6
1
作者
吐尔地.托合提
艾克白尔.帕塔尔
艾斯卡尔.艾木都拉
机构
新疆大学信息科学与工程学院
新疆多语种信息技术重点实验室
出处
《计算机应用研究》
CSCD
北大核心
2013年第2期429-431,435,共4页
基金
国家自然科学基金资助项目(61063022
61262062
+4 种基金
61163033
61163032)
国家教育部新世纪优秀人才支持计划资助项目(NCET-10-0969)
新疆维吾尔自治区高技术研究发展计划资助项目(201212124)
新疆多语种信息技术重点实验室开放课题资助项目(XJDX0905)
文摘
传统的分词方法将一个维吾尔文语义词(多词关联模式)拆分成与词意义不符的若干个片段,因此在维吾尔语文本分析及文本处理过程中导致许多问题,严重影响文本处理效率。提出了一种维吾尔文组词的全新概念,用互信息作为相邻单词间关联程度的度量,实现了基于分段式策略和增量式策略的两种自适应组词算法,并与传统的分词方法得到的词汇表进行对比分析。实验结果表明,组词算法能够非常有效地提取文本中的语义词,两种算法在大规模文本集上的组词准确率分别达到了84.31%和88.24%。
关键词
维吾尔文
传统分词
语义词
互信息
组词
Keywords
Uyghur text
traditional segmentation
semantic word
mutual information
word grouping
分类号
TP351 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于互信息的维吾尔文自适应组词算法
吐尔地.托合提
艾克白尔.帕塔尔
艾斯卡尔.艾木都拉
《计算机应用研究》
CSCD
北大核心
2013
6
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部