期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于加权改进贝叶斯算法的维吾尔文文本分类 被引量:5
1
作者 陈洋 哈力旦.阿布都热依木 +1 位作者 伊力亚尔.达吾提 亚力青.阿里玛斯 《计算机工程与设计》 CSCD 北大核心 2014年第6期1999-2003,共5页
为了提高朴素贝叶斯分类器在维吾尔文本中的分类性能,在具体分析维吾尔文文字特性的基础上,对其进行向量化预处理,降低空间维度。考虑到特征项在集合中的具体分布情况,从特征项的区分度和代表性的角度出发,结合词频,提出了3个权重调整系... 为了提高朴素贝叶斯分类器在维吾尔文本中的分类性能,在具体分析维吾尔文文字特性的基础上,对其进行向量化预处理,降低空间维度。考虑到特征项在集合中的具体分布情况,从特征项的区分度和代表性的角度出发,结合词频,提出了3个权重调整系数,对传统的权值函数TFIDF进行了改进,修正了不同特征词对分类的贡献度。在构建的维吾尔文语料库上进行实验,实验结果表明,与朴素贝叶斯算法相比,此算法具有更好的分类性能。 展开更多
关键词 文本分类 维吾尔文 朴素贝叶斯 词频反文档频 权值调整
在线阅读 下载PDF
面向维吾尔文的多模式匹配算法研究 被引量:1
2
作者 伊力亚尔.达吾提 哈力旦.阿布都热依木 杨娜娜 《计算机工程》 CAS CSCD 北大核心 2015年第1期143-149,共7页
维吾尔文多模式匹配算法是影响维吾尔文关键词过滤和检测性能的关键步骤之一。为此,考虑维吾尔文语法特点、书写方式、字母变换形式、特殊字母等因素,提出一种基于维吾尔文音节划分的多模式匹配算法。通过Bohumsani函数的维吾尔语音... 维吾尔文多模式匹配算法是影响维吾尔文关键词过滤和检测性能的关键步骤之一。为此,考虑维吾尔文语法特点、书写方式、字母变换形式、特殊字母等因素,提出一种基于维吾尔文音节划分的多模式匹配算法。通过Bohumsani函数的维吾尔语音节分解方法计算字符串音节数,利用Bohumxekli函数得到字符串音节结构,按语法特点从右至左方式进行模式比较,实现维吾尔文多模式匹配。实验结果表明,与现有模式匹配算法相比,该算法具有更高的匹配效率。 展开更多
关键词 维吾尔文 特殊字母 词边界 音节划分 音节结构 模式匹配
在线阅读 下载PDF
基于SIFT图像配准的维吾尔语文字识别方法 被引量:2
3
作者 杨娜娜 哈力旦.阿布都热依木 伊力亚尔.达吾提 《传感器与微系统》 CSCD 北大核心 2014年第3期40-43,共4页
提出一种新的维吾尔语文字识别研究方法。首先,建立字符样本库,并对库中文字图像归一化。然后,将测试图像与样本图像进行垂直和水平双方向投影相关性检测,对与测试图像双投影相关性较高的样本字符进行笔画数特征提取,得到预分类结果。最... 提出一种新的维吾尔语文字识别研究方法。首先,建立字符样本库,并对库中文字图像归一化。然后,将测试图像与样本图像进行垂直和水平双方向投影相关性检测,对与测试图像双投影相关性较高的样本字符进行笔画数特征提取,得到预分类结果。最后,将测试图像与预分类结果进行SIFT关键点检测、方向描述子生成与配准,与测试图片匹配点对最多的预分类结果为识别结果,并输出该结果标记符号对应的维吾尔语字符。实验结果表明:该方法能减少字符样本的数量,并有效解决测试图像尺度与几何形变的差异造成的匹配困难问题。 展开更多
关键词 维吾尔语 文字识别 双投影 SIFT
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部