摘要
频繁模式挖掘是生物网络数据分析中的一个核心问题,对于研究生物网络的组织结构和功能模块具有重要意义.本文提出了子图环分布的概念并构造了子图搜索算法,提高了搜索效率.其次设计了动态抽样算法计算子图频率,用于提高非穷举搜索的精度.利用4个真实生物网络数据进行仿真实验研究,验证了本文算法在效率和精度上相对于现有算法的优势.
Frequent pattern mining has emerged as a key issue for analyzing the biological networks since it gives us insights into the organism and functional modules.A novel algorithm for this problem is proposed,which can efficiently obtain all these frequent subgraphs in networks based on the distribution of ring.To improve the accuracy of subgraph mining in non-exhaustive enumerate mode,additionally,we provide a dynamic sample algorithm.The experimental results in four real bio-networks show the superiority of our algorithm to existing algorithms.
出处
《电子学报》
EI
CAS
CSCD
北大核心
2010年第8期1803-1807,共5页
Acta Electronica Sinica
基金
国家自然科学基金重点项目(No.60933009)
高等学校博士学科点专项科研基金(No.200807010013)
关键词
生物网络
频繁模式
子图搜索
biological network
frequent pattern
subgraph search
作者简介
赵建邦 男,1983年生于陕西渭南,现在西安电子科技大学计算机学院攻读计算机应用技术专业博士学位,研究方向为生物信息数据挖掘.E—mail:zjb9797@foxmail.com
董安国 男,1964年生于浙江象山,西安长安大学教授,硕士生导师,于1987年毕业于西安交通大学数学系.主要从事生物信息学、图论与矩阵论算法及其应用的研究工作.