期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
一种改进型局部二值模式的维吾尔文定位算法 被引量:7
1
作者 李敏强 哈力旦.阿布都热依木 闫轲 《河南科技大学学报(自然科学版)》 CAS 北大核心 2015年第3期43-47,53,共6页
针对自然场景中复杂的背景纹理对文本区域检测的干扰,提出了一种改进型局部二值模式(ULBP)提取算法,用于维吾尔文文本特征提取,并用获得的特征向量对候选维吾尔文本区域进行分类。本算法首先利用同质化映射来构建图像的同质化空间;然后... 针对自然场景中复杂的背景纹理对文本区域检测的干扰,提出了一种改进型局部二值模式(ULBP)提取算法,用于维吾尔文文本特征提取,并用获得的特征向量对候选维吾尔文本区域进行分类。本算法首先利用同质化映射来构建图像的同质化空间;然后,在同质化空间利用角点检测快速获取候选文本区域;最后,在候选文本区域里提取ULBP特征,把这些特征导入训练后的支持向量机(SVM)即可获得精确的文本区域。实验结果表明:ULBP特征对维吾尔文本区域具有较高的区分度,且能使误检率降低到8.3%,鲁棒性较强。 展开更多
关键词 维吾尔文文本定位 自然场景 改进型局部二值模式 支持向量机
在线阅读 下载PDF
基于加权改进贝叶斯算法的维吾尔文文本分类 被引量:5
2
作者 陈洋 哈力旦.阿布都热依木 +1 位作者 亚尔.达吾提 青.阿里玛斯 《计算机工程与设计》 CSCD 北大核心 2014年第6期1999-2003,共5页
为了提高朴素贝叶斯分类器在维吾尔文本中的分类性能,在具体分析维吾尔文文字特性的基础上,对其进行向量化预处理,降低空间维度。考虑到特征项在集合中的具体分布情况,从特征项的区分度和代表性的角度出发,结合词频,提出了3个权重调整系... 为了提高朴素贝叶斯分类器在维吾尔文本中的分类性能,在具体分析维吾尔文文字特性的基础上,对其进行向量化预处理,降低空间维度。考虑到特征项在集合中的具体分布情况,从特征项的区分度和代表性的角度出发,结合词频,提出了3个权重调整系数,对传统的权值函数TFIDF进行了改进,修正了不同特征词对分类的贡献度。在构建的维吾尔文语料库上进行实验,实验结果表明,与朴素贝叶斯算法相比,此算法具有更好的分类性能。 展开更多
关键词 文本分类 维吾尔文 朴素贝叶斯 词频反文档频 权值调整
在线阅读 下载PDF
一种新的维吾尔文文本分类特征选择方法 被引量:1
3
作者 何燕 哈力旦.阿布都热依木 +1 位作者 阿丽亚.艾尔肯 吴冰冰 《河南科技大学学报(自然科学版)》 CAS 北大核心 2016年第3期42-46,6-7,共5页
针对传统卡方统计量方法对特征项的频数和类别分布考虑不足的缺陷,提出了一种结合余弦相似度的卡方统计量特征选择方法。该方法首先使用均值词频-逆文档频率表示特征项,通过引入一个调整公式来平衡类间选取的特征项数,从而对传统卡方统... 针对传统卡方统计量方法对特征项的频数和类别分布考虑不足的缺陷,提出了一种结合余弦相似度的卡方统计量特征选择方法。该方法首先使用均值词频-逆文档频率表示特征项,通过引入一个调整公式来平衡类间选取的特征项数,从而对传统卡方统计量方法进行修正,然后结合余弦相似度进一步消除噪声文本。在收集的维吾尔文数据集上进行实验论证。实验结果表明:改进的卡方统计量方法具有较好的鲁棒性,且分类性能优于传统的卡方统计量方法。 展开更多
关键词 维吾尔文 卡方统计量 余弦相似度 特征选择
在线阅读 下载PDF
人工鱼群优化的维吾尔文文本特征选择方法 被引量:1
4
作者 吴冰冰 哈力旦.阿布都热依木 +1 位作者 阿丽亚.艾尔肯 何燕 《河南科技大学学报(自然科学版)》 CAS 北大核心 2016年第6期46-50,7,共5页
特征选择是文本分类中的关键步骤,对分类结果产生直接的影响。本文分析了人工鱼群算法的觅食行为、群聚行为和追尾行为等基本原理。结合维吾尔文文本特征提取原理,提出了一种改进的人工鱼群算法,并将其运用到维吾尔文文本特征提取当中... 特征选择是文本分类中的关键步骤,对分类结果产生直接的影响。本文分析了人工鱼群算法的觅食行为、群聚行为和追尾行为等基本原理。结合维吾尔文文本特征提取原理,提出了一种改进的人工鱼群算法,并将其运用到维吾尔文文本特征提取当中。为了加快鱼群的收敛速度,引入了主动改变视野的策略,同时,为了避免算法陷入局部最优,还在算法中加入了变异策略。将特征选择后的样本集输入到不同的分类器中进行仿真实验。实验结果表明:改进的人工鱼群算法能够使分类的准确率达到94.5%。 展开更多
关键词 维吾尔文 文本分类 特征选择 人工鱼群算法
在线阅读 下载PDF
印刷体维吾尔文字符切分自适应算法 被引量:3
5
作者 张振东 哈力旦.阿布都热依木 赵永霄 《计算机工程与设计》 CSCD 北大核心 2014年第10期3685-3690,共6页
为研究开发维吾尔文摄像头取词翻译系统,解决其中维吾尔文字单词图像切分难题,提出一种印刷体维吾尔文字符自适应切分算法。针对摄像头取词图像特点,准确提取目标单词;利用维吾尔文单词基线以上的主体部分做像素积分投影,从投影结果中... 为研究开发维吾尔文摄像头取词翻译系统,解决其中维吾尔文字单词图像切分难题,提出一种印刷体维吾尔文字符自适应切分算法。针对摄像头取词图像特点,准确提取目标单词;利用维吾尔文单词基线以上的主体部分做像素积分投影,从投影结果中自动提取切分阈值;利用该阈值完成字符切分,达到自适应的效果。经过实验验证,该方法切分正确率达到了96%以上,针对不同图像具有较好的适应性,对维吾尔文摄像头取词翻译系统的研究具有促进作用。 展开更多
关键词 摄像头取词 印刷体维吾尔文 自适应阈值 部分投影 字符切分
在线阅读 下载PDF
基于深度置信网络的维吾尔文垃圾短信分类技术研究 被引量:6
6
作者 阿丽亚.艾尔肯 哈力旦.阿布都热依木 +1 位作者 何燕 吴冰冰 《计算机工程与科学》 CSCD 北大核心 2016年第10期2134-2139,共6页
针对传统分类算法对维吾尔文文本分类准确率不高的问题,提出了一种基于深度置信网络的维吾尔文短信文本分类模型。深度学习模拟人脑的多层次结构,对数据从低层到高层逐渐地进行特征提取,深层挖掘数据集的分布规律,从而提高分类准确性。... 针对传统分类算法对维吾尔文文本分类准确率不高的问题,提出了一种基于深度置信网络的维吾尔文短信文本分类模型。深度学习模拟人脑的多层次结构,对数据从低层到高层逐渐地进行特征提取,深层挖掘数据集的分布规律,从而提高分类准确性。通过逐层无监督的方法完成深度置信网络的初始化,并结合softmax回归分类器实现文本的分类。最后在收集的维吾尔文短信数据集上进行实验论证。实验结果表明,相比KNN、SVM和决策树算法,深度置信网络具有更好的分类效果,准确率更高。 展开更多
关键词 深度置信网络 维吾尔文 垃圾短信 文本分类
在线阅读 下载PDF
改进信息增益的维吾尔文特征选择方法 被引量:3
7
作者 韩军兵 哈力旦.阿布都热依木 +1 位作者 努尔.艾尔肯 何燕 《计算机工程与应用》 CSCD 北大核心 2017年第23期34-38,共5页
特征选择是维吾尔语文本分类的关键技术,对分类结果将产生直接的影响。为了提高传统信息增益在维吾尔文特征选择中的效果,在深度分析维吾尔文语种特点的基础上,提出了一种新的信息增益特征选择方法。该方法结合类词频和特征分布系数以... 特征选择是维吾尔语文本分类的关键技术,对分类结果将产生直接的影响。为了提高传统信息增益在维吾尔文特征选择中的效果,在深度分析维吾尔文语种特点的基础上,提出了一种新的信息增益特征选择方法。该方法结合类词频和特征分布系数以及倒逆文档频率,对传统信息增益进行修正;引入一个备选特征分布系数来平衡类间选取的特征个数;在维吾尔文数据集上实验验证。实验结果表明,改进的算法对维吾尔文分类效果有明显的提高。 展开更多
关键词 文本分类 信息增益 类词频 倒逆转文档频率 特征选择
在线阅读 下载PDF
基于基线的视频维吾尔文字幕帧提取研究 被引量:1
8
作者 张鲁建 哈力旦.阿布都热依木 黄浩 《传感器与微系统》 CSCD 北大核心 2013年第4期65-68,71,共5页
根据维吾尔文字独有的基线特性,提出了一种新的视频维吾尔文字幕帧提取方法,首先进行维吾尔文字幕帧的读取,然后根据相邻帧之间的像素帧间差异和区域像素统计对视频段作初步镜头关键帧的检测,之后对检测到的镜头关键帧作区域处理,检测... 根据维吾尔文字独有的基线特性,提出了一种新的视频维吾尔文字幕帧提取方法,首先进行维吾尔文字幕帧的读取,然后根据相邻帧之间的像素帧间差异和区域像素统计对视频段作初步镜头关键帧的检测,之后对检测到的镜头关键帧作区域处理,检测视频帧中是否具有基线特性,再根据基线设置阈值,最后提取出代表视频语义的主要视频帧。实验证明:该提取方法简洁有效,其字幕帧提取率平均可达到85%以上。 展开更多
关键词 基线 维吾尔文 字幕帧提取 帧差 HOUGH变换
在线阅读 下载PDF
基于SIFT图像配准的维吾尔语文字识别方法 被引量:2
9
作者 杨娜娜 哈力旦.阿布都热依木 亚尔.达吾提 《传感器与微系统》 CSCD 北大核心 2014年第3期40-43,共4页
提出一种新的维吾尔语文字识别研究方法。首先,建立字符样本库,并对库中文字图像归一化。然后,将测试图像与样本图像进行垂直和水平双方向投影相关性检测,对与测试图像双投影相关性较高的样本字符进行笔画数特征提取,得到预分类结果。最... 提出一种新的维吾尔语文字识别研究方法。首先,建立字符样本库,并对库中文字图像归一化。然后,将测试图像与样本图像进行垂直和水平双方向投影相关性检测,对与测试图像双投影相关性较高的样本字符进行笔画数特征提取,得到预分类结果。最后,将测试图像与预分类结果进行SIFT关键点检测、方向描述子生成与配准,与测试图片匹配点对最多的预分类结果为识别结果,并输出该结果标记符号对应的维吾尔语字符。实验结果表明:该方法能减少字符样本的数量,并有效解决测试图像尺度与几何形变的差异造成的匹配困难问题。 展开更多
关键词 维吾尔语 文字识别 双投影 SIFT
在线阅读 下载PDF
面向维吾尔文的多模式匹配算法研究 被引量:1
10
作者 亚尔.达吾提 哈力旦.阿布都热依木 杨娜娜 《计算机工程》 CAS CSCD 北大核心 2015年第1期143-149,共7页
维吾尔文多模式匹配算法是影响维吾尔文关键词过滤和检测性能的关键步骤之一。为此,考虑维吾尔文语法特点、书写方式、字母变换形式、特殊字母等因素,提出一种基于维吾尔文音节划分的多模式匹配算法。通过Bohumsani函数的维吾尔语音... 维吾尔文多模式匹配算法是影响维吾尔文关键词过滤和检测性能的关键步骤之一。为此,考虑维吾尔文语法特点、书写方式、字母变换形式、特殊字母等因素,提出一种基于维吾尔文音节划分的多模式匹配算法。通过Bohumsani函数的维吾尔语音节分解方法计算字符串音节数,利用Bohumxekli函数得到字符串音节结构,按语法特点从右至左方式进行模式比较,实现维吾尔文多模式匹配。实验结果表明,与现有模式匹配算法相比,该算法具有更高的匹配效率。 展开更多
关键词 维吾尔文 特殊字母 词边界 音节划分 音节结构 模式匹配
在线阅读 下载PDF
面向增量同生主题的维吾尔文爬虫的研究 被引量:1
11
作者 赵永霄 哈力旦.阿布都热依木 张振东 《计算机应用研究》 CSCD 北大核心 2014年第11期3269-3272,共4页
针对传统的主题爬虫对网页信息缺乏在知识层面上的处理和理解的问题进行了研究,提出了一种面向增量同生主题的维吾尔文爬虫,通过建立一个增量主题词库优化传统的主题模型,来描述维吾尔文关键词的应用语境及场景,提高了计算网页相关度的... 针对传统的主题爬虫对网页信息缺乏在知识层面上的处理和理解的问题进行了研究,提出了一种面向增量同生主题的维吾尔文爬虫,通过建立一个增量主题词库优化传统的主题模型,来描述维吾尔文关键词的应用语境及场景,提高了计算网页相关度的准确率。用改进的IC主题敏感算法来预测子页面优先级,过滤无关的网页地址。依据上述方法编写爬虫系统,用构建的维吾尔文语料库进行实验,表明了基于此模型的爬虫具有更好的稳定性和准确度。 展开更多
关键词 网络爬虫 网页分类 IC主题模型 锚文本 维吾尔文
在线阅读 下载PDF
基于Hadoop的维吾尔文文本分类 被引量:1
12
作者 艾比布拉.阿不拉 马振 +1 位作者 哈力旦.阿布都热依木 吴冰冰 《计算机工程与设计》 北大核心 2018年第8期2500-2504,共5页
针对维吾尔文组词算法在文本分类中的分类性能不高,以及处理海量数据困难等问题,提出一种改进维吾尔文组词算法(DM),并设计一种基于Hadoop和改进维吾尔文组词算法的文本分类模型。对文本进行分段式处理,对每段分别采用DM组词算法,利用Ma... 针对维吾尔文组词算法在文本分类中的分类性能不高,以及处理海量数据困难等问题,提出一种改进维吾尔文组词算法(DM),并设计一种基于Hadoop和改进维吾尔文组词算法的文本分类模型。对文本进行分段式处理,对每段分别采用DM组词算法,利用MapReduce编程模型实现该算法的并行化设计,结合Mahout贝叶斯分类算法进行文本分类,实验结果表明,该模型具有较好的分类结果。 展开更多
关键词 Hadoop分布式系统 文本分类 维吾尔文 DM组词算法 Mahout分布式项目 贝叶斯分类算法
在线阅读 下载PDF
海量样本数据集中小文件的存取优化研究 被引量:5
13
作者 马振 哈力旦.阿布都热依木 李希彤 《计算机工程与应用》 CSCD 北大核心 2018年第22期80-84,98,共6页
针对Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)在海量样本数据集存储方面存在内存占用多、读取效率低的问题,以及分布式数据库HBase在存储文件名重复度和类似度高时产生访问热点的问题,结合样本数据集的特点、类型,... 针对Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)在海量样本数据集存储方面存在内存占用多、读取效率低的问题,以及分布式数据库HBase在存储文件名重复度和类似度高时产生访问热点的问题,结合样本数据集的特点、类型,提出一种面向样本数据集存取优化方案,优化样本数据集中小文件的写入、读取、添加、删除和替换策略。该方案根据硬件配置测得大、小文件的分界点,通过变尺度堆栈算法按样本数据集的目录结构将小文件合并存储至HDFS;结合行键优化策略将文件索引存储在HBase数据表中;搭建基于Ehcache缓存框架的预取机制。实验结果表明,该方案降低了主节点的内存消耗,提高了文件的读取效率,实现了对海量样本数据集中小文件的高效存取。 展开更多
关键词 Hadoop分布式文件系统(HDFS) 小文件 样本数据集 缓存预取 分布式数据库 HBASE
在线阅读 下载PDF
一种新的维吾尔文字幕关键帧提取方法
14
作者 闫轲 哈力旦.阿布都热依木 李敏强 《安徽大学学报(自然科学版)》 CAS 北大核心 2015年第5期68-73,共6页
为了快速有效地提取视频中含有维吾尔文字幕的关键帧提出一种新方法.该方法首先运用多尺度Harris角点检测,结合维吾尔文字笔画特点,完成字幕关键帧的初步提取;然后利用最小二乘法拟合直线,根据两条拟合直线的角度偏离情况对初步提取的... 为了快速有效地提取视频中含有维吾尔文字幕的关键帧提出一种新方法.该方法首先运用多尺度Harris角点检测,结合维吾尔文字笔画特点,完成字幕关键帧的初步提取;然后利用最小二乘法拟合直线,根据两条拟合直线的角度偏离情况对初步提取的结果作去冗余处理,得到最终字幕关键帧.实验结果表明:该方法快速简单,提取结果的准确率达到93%,具有很好的适应性. 展开更多
关键词 维吾尔文 关键帧提取 多尺度Harris角点检测 直线拟合
在线阅读 下载PDF
基于改进Otsu与四叉树法的Marangoni凝结液边缘检测方法
15
作者 努尔.艾尔肯 哈力旦.阿布都热依木 +1 位作者 胡申华 韩军兵 《科学技术与工程》 北大核心 2017年第8期187-191,共5页
针对图像中Marangoni凝结液边缘由模糊性引起的不确定性问题,以及为后续计算凝结液面积和统计提供科学依据,提出了一种基于改进的Otsu法和四叉树结构相结合的新型边缘检测方法。先自动确定高低阈值分割图像、去噪,采用四叉树法定位凝结... 针对图像中Marangoni凝结液边缘由模糊性引起的不确定性问题,以及为后续计算凝结液面积和统计提供科学依据,提出了一种基于改进的Otsu法和四叉树结构相结合的新型边缘检测方法。先自动确定高低阈值分割图像、去噪,采用四叉树法定位凝结液的位置;再考虑到复杂纹理特征,通过逻辑运算进一步处理了噪声,完善了凝结液的完整性。最后用Canny算子获得了很好的凝结液边缘。实验结果表明,对凝结液提取具有较高的区分度且精确性高、鲁棒性较强,降低了计算凝结液半径、覆盖率、换热系数等的复杂性,提高了计算速度,在工业设计方面有着重要的意义。 展开更多
关键词 MARANGONI凝结 四叉树 改进OTSU法 边缘检测
在线阅读 下载PDF
Gabor新融合算法的维吾尔族人脸识别 被引量:1
16
作者 赵旭杰 哈力旦.阿布都热依木 哈木.亚尔买买提 《现代电子技术》 北大核心 2019年第2期133-137,共5页
针对维吾尔族人脸在遮挡和非均匀光照下导致其识别率低的问题,提出Gabor和非负矩阵在频域内融合识别的算法。首先对复杂场景中维吾尔族人脸进行预处理;然后对有遮挡的维吾尔族人脸图像进行多尺度、多方向Gabor局部特征提取,并同时在频... 针对维吾尔族人脸在遮挡和非均匀光照下导致其识别率低的问题,提出Gabor和非负矩阵在频域内融合识别的算法。首先对复杂场景中维吾尔族人脸进行预处理;然后对有遮挡的维吾尔族人脸图像进行多尺度、多方向Gabor局部特征提取,并同时在频域中对实部和虚部分别进行稀疏非负矩阵分解算法提取特征,由于局部提取的特征维数较高,因此进一步做2DPCA降维处理;最后通过支持向量机分类方法对有遮挡和非均匀光照的维吾尔族人脸进行分类识别。实验结果表明,文中识别算法对遮挡和非均匀光照时在Yale、ORL、维吾尔族人脸数据库有较强的识别效果,在识别率和鲁棒性方面有明显提高。 展开更多
关键词 维吾尔族人脸 GABOR 非负矩阵 支持向量机 特征提取 融合算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部