期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于Bert+GCN多模态数据融合的药物分子属性预测 被引量:1
1
作者 闫效莺 靳艳春 +1 位作者 冯月华 张绍武 《生物化学与生物物理进展》 北大核心 2025年第3期783-794,共12页
目的药物研发成本高、周期长且成功率低。准确预测分子属性对有效筛选药物候选物、优化分子结构具有重要意义。基于特征工程的传统分子属性预测方法需研究人员具备深厚的学科背景和广泛的专业知识。随着人工智能技术的不断成熟,涌现出... 目的药物研发成本高、周期长且成功率低。准确预测分子属性对有效筛选药物候选物、优化分子结构具有重要意义。基于特征工程的传统分子属性预测方法需研究人员具备深厚的学科背景和广泛的专业知识。随着人工智能技术的不断成熟,涌现出大量优于传统特征工程方法的分子属性预测算法。然而这些算法模型仍然存在标记数据稀缺、泛化性能差等问题。鉴于此,本文提出一种基于Bert+GCN的多模态数据融合的分子属性预测算法(命名为BGMF),旨在整合药物分子的多模态数据,并充分利用大量无标记药物分子训练模型学习药物分子的有用信息。方法本文提出了BGMF算法,该算法根据药物SMILES表达式分别提取了原子序列、分子指纹序列和分子图数据,采用预训练模型Bert和图卷积神经网络GCN结合的方式进行特征学习,在挖掘药物分子中“单词”全局特征的同时,融合了分子图的局部拓扑特征,从而更充分利用分子全局-局部上下文语义关系,之后,通过对原子序列和分子指纹序列的双解码器设计加强分子特征表达。结果5个数据集共43个分子属性预测任务上,BGMF方法的AUC值均优于现有其他方法。此外,本文还构建独立测试数据集验证了模型具有良好的泛化性能。对生成的分子指纹表征(molecular fingerprint representation)进行t-SNE可视化分析,证明了BGMF模型可成功捕获不同分子指纹的内在结构与特征。结论通过图卷积神经网络与Bert模型相结合,BGMF将分子图数据整合到分子指纹恢复和掩蔽原子恢复的任务中,可以有效地捕捉分子指纹的内在结构和特征,进而高效预测药物分子属性。 展开更多
关键词 Bert预训练 注意力机制 分子指纹 分子属性预测 图卷积神经网络
在线阅读 下载PDF
基于因果机制的分子属性预测
2
作者 蔡瑞初 许遵鸿 +3 位作者 陈道鑫 杨振辉 李梓健 郝志峰 《计算机工程》 北大核心 2025年第3期105-112,共8页
在量子化学领域,分子性质预测是一项基础而关键的任务,广泛应用于药物发现、化学合成预测等多个领域。随着人工智能的发展,深度学习方法在该领域得到了广泛应用。然而,当前的方法往往采用微观和宏观视图两种极端的抽象层次来对分子性质... 在量子化学领域,分子性质预测是一项基础而关键的任务,广泛应用于药物发现、化学合成预测等多个领域。随着人工智能的发展,深度学习方法在该领域得到了广泛应用。然而,当前的方法往往采用微观和宏观视图两种极端的抽象层次来对分子性质进行建模,导致难以推广到分布之外样本的挑战。化学的介观视图提供了一个有益的中间层次,通过包含与性质相关的功能基团的介观成分来描述分子性质。通过考虑这些介观成分,并从因果关系的角度对其进行建模,可以更加关注与性质相关的功能基团。为了实现该目标,提出一种介观成分识别模型。该模型基于分子数据的介观因果生成过程和变分自编码器的框架,通过学习与分子性质相关的介观成分的表示,实现对分子性质的预测。首先假设原子隐变量遵循高斯分布和语义隐子结构遵循多元伯努利分布,将分子数据输入神经网络来识别原子隐变量和语义隐子结构。接着利用识别出来的原子隐变量和语义隐子结构来预测分子性质。为了能够识别出原子隐变量和语义隐子结构,利用变分下界和稀疏项来构造模型的损失函数。实验结果表明,该模型不仅在性能上取得先进的结果,而且提供了深入的解释,为模型预测提供了更全面的理解,提高分子性质预测的准确性和泛化能力。 展开更多
关键词 分子属性预测 因果 分布外泛化 图表征 图神经网络
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部