-
题名基于相似性混合模型的蛋白质交互识别
被引量:2
- 1
-
-
作者
王宇伟
牛耘
魏欧
-
机构
南京航空航天大学计算机科学与技术学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2015年第7期25-30,35,共7页
-
基金
国家自然科学基金资助项目(61202132
61170043)
-
文摘
现有采用机器学习方法的蛋白质交互关系识别系统仅以单句为依据,并且存在标注数据缺乏导致训练集规模小的问题。为此,基于相似性混合模型提出一种新的蛋白质交互识别方法。采用基本的关系相似性(RS)模型做初始判断,利用大规模文本计算单词特征间的相似性,在基本RS模型的基础上通过特征聚类方式引入单词相似性模型,从而建立一个混合模型。实验结果表明,该方法能够取得较高且较均衡的精确度和召回率,而单词相似性的引入又进一步提高了F值,并且其直接利用已有的交互信息,可避免额外的人工标注。
-
关键词
蛋白质交互
关系相似性
单词相似性
K近邻分类
层次聚类
-
Keywords
Protein-protein Interaction(PPI)
Relational Similarity (RS)
word similarity
K-nearest Neighbor(KNN) classification
hierarchical clustering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-