-
题名基于全域跨语义融合的多级酶功能预测
- 1
-
-
作者
周汉文
邓赵红
张炜
-
机构
江南大学人工智能与计算机学院
-
出处
《计算机科学与探索》
北大核心
2025年第6期1588-1597,共10页
-
基金
国家自然科学基金(62176105)。
-
文摘
蛋白质在生物活动中发挥着关键作用,酶作为一种重要的蛋白质,因其催化功能在多个领域得到广泛应用。然而,通过生化实验验证酶的功能既费时又昂贵。传统的酶功能注释方法主要依赖于序列相似性,但在目标酶序列与已知酶差异较大时,这些方法效果不佳。近年来,科研人员初步探索了一些基于深度学习的方法,但现有的深度学习方法受限于传统酶序列编码方式,并且仅利用单一视图或单层次的信息,这使得模型在处理结构复杂或功能多样的酶时表现出一定的局限性。对此,提出一种新的全域跨语义融合的多级酶功能预测方法(GCMEFP)。所提方法使用了两种最新的蛋白质大语言模型进行序列词嵌入学习。构建了多语义深度特征学习模块,该模块通过卷积神经网络构建语义金字塔,实现了不同层级语义信息的提取。还提出了全域跨视图语义融合模块,用于探索不同视图之间隐藏的相互作用信息,并去除冗余信息来增强模型的泛化性。实验结果表明:提出的GCMEFP在基准数据集上的精度达到89.6%,较现有最优方法高出0.048;在独立测试集New-379上的精度达到55.6%,较现有最优方法高出0.14。
-
关键词
多级酶功能预测
多语义深度特征学习
大模型词嵌入
多视图特征融合
-
Keywords
multi-level enzyme function prediction
multi-semantic deep feature learning
large language model word embedding
multi-view feature aggregation
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-