基于后缀树思想构造Web生物数据搜索的数据模型被引量：1

Creating a data model based on suffix trees for searching biological databases on the web

在线阅读下载PDF

导出

摘要针对Web上的公共生物学数据资源,提出一种适合于在线搜索生物学数据的数据模型.该模型基于后缀树思想,通过建立生物体的DNA、RNA、蛋白质序列数据的后缀树结构,并将之转化为更加空间有效的后缀数组,然后搜索数组以找到查询序列的近似匹配.结果表明,这种数据模型比常规的线性搜索模型在时间和空间开销上更加高效. One data model used for searching public biological databases on the web is proposed. It is based on an idea of suffix trees. In order to find out approximate matches of a query sequence within a sequence database of DNA, RNA or protein, a suffix tree of the database is created, as well as converted into a suffix array. As a result, this kind of data model is more time efficiency and more space reduction than nomal linear model.

作者喻钧王长元 Sven Schuierer 喻萌

机构地区西安工业学院计算机科学与工程学院 Institut fuer Informatik Albert-Ludwigs-Universitaet Freiburg 中国航空工业第一集团公司飞行自动控制研究所

出处《西安工程科技学院学报》 2006年第2期206-209,共4页 Journal of Xi an University of Engineering Science and Technology

关键词生物学数据库搜索后缀树后缀数组 biological database searching suffix tree suffix array

分类号 TP311.12 [自动化与计算机技术—计算机软件与理论] G354.4 [文化科学—情报学]

作者简介喻钧（1970-）, 女,重庆市人,西安工业学院讲师,硕士,主要从事Web数据挖掘、信息系统和生物信息学等方面的研究. E-mail： jyu0117@163.com 通讯作者

引文网络
相关文献

参考文献4

1UDI Manber,GENE Myers,SUFFIX Arrays.A new method for on-line string searches[J].SIAM Journal on Computing,1993,22(5):935-948.
2DAN Gusfield.Algorithms on Strings,Trees and Sequences:Computer Science and Computational Biology[M].Cambridge:Cambridge University Press,1998.
3CYNTBIA Gibas,PER Jambeck.Developing Bioinformatics Computer Skills[M].USA:O'Reilly Media Inc,2002.
4SUNG Wing-kin.Searching biological database[EB/OL].(2005-08)[2005-12-20].http://www.comp.nus.edu.sg/～ksung/cs5238/note/Lect3-database_2005.pdf.

同被引文献10

1申展,江宝林,张谧,唐磊,胡运发.互关联后继树模型及其实现[J].计算机应用与软件,2005,22(3):7-9. 被引量：10
2U. Manber and G. Myers. Suffix arrays: A new method for on-line string searches [J]. SIAM Journal on Computing, 1993, (22):935-948.
3Paolo Ferragina , Giovanni Manzini, Veli Makinen, Conzalo Navarro. An Alphabet-Friendly FM-Index[C]. SPIRE,2004: 150-160.
4Chen M S, Park J S, Yu P S. Efficient Data Mining for Path Travsersal Patems[J]. IEEE Trans. Knowledge Data Engineer, 1998,10 (2) : 209-211.
5Pei J, Han J, Mortazavi B, et al. Mining Access Patterns Efficiently from Web Logs[C]. In: Proceedings 2000 Pacific-Asia Conference on Knowledge Discovery and Data Mining, Kyoto, Japan(PAKDD00), 2000:4.
6R. Grossi and J. Vitter. Compressed suffix arrays and suffix trees with applications to text indexing and string matching [C]. In Proceedings of the 32nd ACM Symposium on Theory of Computing, 2000.
7G.Gonnet, R. Baeza-Yates, T. Snider, New indices for text: PAT trees and PAT arrays [C]. in: W. Frakes, R.A. Baeza- Yates (Eds.),Information Retrieval: Algorithms and Data Structures,Prentice-Hall, Englewood Cliffs, NJ, 1992:66- 82.
8G. Jacobson. Succinct static data structures [T]. Technical Report CMU-CS-89-112, Dept. of Computer Science, Carnegie-Mellon University, Jan. 1989.
9K. Sadakane. Compressed text databases with efficient query algorithms based on the compressed suffix arrays[C]. In Proceedings of the 11th International Symposium on Algorithms and Computation . Springer-Verlag LNCS 1969, 2000:410-421.
10刘学文,陶晓鹏,于玉,胡运发.一种全新的全文索引模型——后继数组模型[J].软件学报,2002,13(1):150-158. 被引量：11

引证文献1

1杨炜鸿,张毅,于洪梅.基于模拟后缀数组索引结构的实现[J].情报科学,2009,27(12):1834-1836.

1徐诗豪.利用互联网获取生命科学信息资源[J].科技情报开发与经济,2004,14(6):46-47.
2喻钧,胡志毅,范会敏,雷聚超.基于后缀数组实现Web上生物学数据库的搜索[J].情报杂志,2006,25(4):105-106.
3代宁.Internet上生物学数据库和软件资源的利用[J].生物学通报,2002,37(7):27-29. 被引量：4
4杜伟,巴永军.基于JavaBean创建web数据库组件[J].胜利油田职工大学学报,2003(4):42-44.
5黄海.一种改进的数据库查询二叉树启发式算法[J].赤峰学院学报（自然科学版）,2017,33(3):38-39.
6忻健,陆巍,朱景德,王翼飞.GenExtractor:一个基于Web的生物信息挖掘系统[J].应用科学学报,2005,23(1):75-81. 被引量：1
7范晓莉,张志平.基于后缀树的西文二次文献相关性算法设计[J].情报杂志,2009,28(6):155-158.
8魏韡,卜登立,周太平.基于语义网技术的生物学数据集成研究[J].井冈山大学学报（自然科学版）,2009,30(5):24-25.
9顾蔚.Internet在生物学中的应用[J].西北大学学报（自然科学版）,1999,29(6):607-610. 被引量：3
10李载常,李军.2003年网络版BA与PubMed检索对比[J].中国图书情报科学,2004(4):23-25.

西安工程科技学院学报

2006年第2期

浏览历史

内容加载中请稍等...

基于后缀树思想构造Web生物数据搜索的数据模型被引量：1

参考文献4

同被引文献10

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于后缀树思想构造Web生物数据搜索的数据模型 被引量：1

参考文献4

同被引文献10

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于后缀树思想构造Web生物数据搜索的数据模型被引量：1