摘要
蛋白质复合物的检测对人类了解细胞组织和疾病预测起着至关重要的作用。然而,当前的蛋白质复合物识别方法的准确率低,对噪音敏感等缺点导致其识别效果并不理想。提出了一种新的蛋白质复合物识别方法PIOC(pigeon-inspired optimization clustering)。该方法根据蛋白质复合物的特性提出了簇的紧密邻接点概念和附件对核心的附着度概念,基于这两个概念,PIOC通过模拟鸽子优化算法中鸽子寻找目的地的过程来识别蛋白质复合物;结合鸽子算法中先全局搜索再局部搜索的特性和蛋白质复合物的核心附件结构,先通过鸽子算法中地图罗盘操作的全局搜索形成蛋白质复合物的核心,再通过鸽子算法地标操作的局部搜索将附件蛋白质聚集到核心簇中形成蛋白质复合物。基于酵母蛋白质相互作用网络DIP上的实验表明,PIOC比当前其他的蛋白质复合物识别算法能更有效地识别蛋白质复合物。
Detecting protein complexes is crucial to understand the principles of cellular organization and predict diseases.Yet up to now,the performance of existing protein complex detection algorithms is not very ideal for the deficiencies of low accuracy,sensitive to noisy data and so on.This paper proposes a novel algorithm named pigeoninspired optimization clustering(PIOC)algorithm.It puts forward the concepts of clusters closely adjacent nodes and attachments attachment degree on core,and identifies protein complexes by simulating the process of pigeons finding home based on these two concepts.The PIOC algorithm combines the characters of first global search then local search of pigeon-inspired optimization(PIO)algorithm and the core-attachment structure of protein complexes.Particularly,it first develops the cores of protein complexes by the global search of PIO??s map and compass operator,and then forms the protein complexes by gathering in the attachment proteins to the cores based on the local search of PIO landmark operation.The experimental results on yeast protein DIP dataset demonstrate that PIOC is more effective in detecting protein complexes than the state-of-the-art complex detection algorithms.
作者
丁玉连
雷秀娟
代才
DING Yulian;LEI Xiujuan;DAI Cai(College of Computer Science, Shaanxi Normal University, Xi’an 710062, China)
出处
《计算机科学与探索》
CSCD
北大核心
2017年第8期1279-1287,共9页
Journal of Frontiers of Computer Science and Technology
基金
国家自然科学基金Nos.61502290
61401263
陕西省工业科技攻关项目No.2015GY016
中国博士后科学基金No.2015M582606
陕西师范大学研究生创新基金No.2015CXS030~~
关键词
蛋白质相互作用(PPI)
鸽子优化算法
蛋白质复合物
聚类
protein-protein interaction (PPI)
pigeon-inspired optimization algorithm
protein complex
clustering
作者简介
丁玉连(1992—),女,河南信阳人,陕西师范大学计算机科学学院硕士研究生,主要研究领域为数据挖掘,生物信息。;Corresponding author: 雷秀娟(1975—),女,陕西长安人,2005年于西北工业大学获得博士学位,现为陕西师范大学教授、博士生导师,主要研究领域为智能计算,生物信息学。E-mail: xjlei168@163.com;代才(1984—),男,安徽阜南人,2014 年于西安电子科技大学获得博士学位,现为陕西师范大学讲师,主要研究领域为多目标优化。