期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于QSA数组计算序列中所有NE重复模式的算法 被引量:3
1
作者 木妮娜.玉素甫 古丽娜.玉素甫 张海军 《计算机科学》 CSCD 北大核心 2014年第3期249-252,262,共5页
序列中重复模式的识别与提取算法在数据挖掘、模式识别、数据压缩、生物信息学等领域中具有广泛的实际应用。提出一种全新的基于QSA数组计算所有带有约束条件的NE重复模式的算法RPT。算法设计中充分考虑了NE重复模式的特征,以建立特征... 序列中重复模式的识别与提取算法在数据挖掘、模式识别、数据压缩、生物信息学等领域中具有广泛的实际应用。提出一种全新的基于QSA数组计算所有带有约束条件的NE重复模式的算法RPT。算法设计中充分考虑了NE重复模式的特征,以建立特征和重复模式检测结果之间的统计联系;算法中的约束条件包括最小周期pmin和最大间距gmax,其可用于筛选符合条件的NE重复模式,并可按照递增序输出所有NE重复模式的出现位置。与已有的基于后缀索引的算法相比,此算法的空间效率得到了提高。在分类属性数据样本集上进行的实验表明,算法RPT对生物序列尤其是DNA序列以及维吾尔语Web文本中NE重复模式的识别与提取都很有效。 展开更多
关键词 重复模式 数据挖掘 统计特征 约束条件 生物计算 维吾尔语Web文本
在线阅读 下载PDF
重复模式识别算法及在Web信息抽取和聚类分析中的应用 被引量:1
2
作者 木妮娜.玉素甫 古丽娜.玉素甫 《计算机科学》 CSCD 北大核心 2017年第B11期39-45,共7页
序列中的重复模式识别算法及应用研究是数据挖掘领域的重要问题,是提取序列中有用信息的主要手段之一。近年来,针对各种重复模式定义、有效的识别算法设计以及重复模式识别算法在有关领域中的应用有了很多研究成果。文中对序列中重复模... 序列中的重复模式识别算法及应用研究是数据挖掘领域的重要问题,是提取序列中有用信息的主要手段之一。近年来,针对各种重复模式定义、有效的识别算法设计以及重复模式识别算法在有关领域中的应用有了很多研究成果。文中对序列中重复模式的类型与特点作了描述,讨论了识别算法中常用的数据结构,以分类的方式重点回顾并总结了近年来重复模式在一些相关领域中的应用及相关算法的设计思路与技巧,并从加入的领域知识及约束、识别结果与算法扩充性、存在的主要问题等方面进行了讨论,其中包括在网络信息抽取、Web文档特征提取与聚类算法及相关的维文信息处理等领域中的应用。最后,讨论了关于序列重复模式识别算法在各个相关领域中的应用研究所面临的挑战,并探讨了未来的研究方向。 展开更多
关键词 重复模式 Web文档特征 网络信息抽取 聚类算法 维文信息处理
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部