期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于蛋白质语言模型和深度残差神经网络的蛋白质与多肽结合残基预测
1
作者 胡俊 陈开心 《小型微型计算机系统》 北大核心 2025年第8期1910-1917,共8页
识别蛋白质-多肽结合残基对于揭示蛋白质功能机制和探索药物发现至关重要.许多计算方法被提出来用于预测多肽结合残基.然而,由于特征表示质量的限制,预测性能仍有很大的提升空间.本文设计了一种新的深度学习模型PL-Pep,从蛋白质序列中... 识别蛋白质-多肽结合残基对于揭示蛋白质功能机制和探索药物发现至关重要.许多计算方法被提出来用于预测多肽结合残基.然而,由于特征表示质量的限制,预测性能仍有很大的提升空间.本文设计了一种新的深度学习模型PL-Pep,从蛋白质序列中挖掘出更多判别性信息,从而提高多肽结合残基预测性能.具体地,首先使用预训练的蛋白质语言模型(ESM2)来提取蛋白质序列高潜在判别表示.接着,设计了一个基于卷积的残差神经网络来训练蛋白质-多肽结合残基预测模型.此外,改进了对比损失函数以提高模型的性能.两个独立测试集的实验结果表明,与大多数的预测方法相比,PL-Pep获得更高的马修相关系数(MCC)和AUC值.详细的数据分析表明,PL-Pep的主要优势在于利用蛋白质语言模型,仅从蛋白质序列中提取更多判别性信息以及利用改进的对比损失函数进一步优化不平衡数据集下的结合残基的特征表示. 展开更多
关键词 蛋白质语言模型 深度学习 特征表示 多肽结合残基 对比损失
在线阅读 下载PDF
基于深度学习和蛋白质语言模型的抗菌肽预测模型研究 被引量:1
2
作者 王晓 吴洲 +2 位作者 王宏伟 王榕 陈浩然 《轻工学报》 CAS 北大核心 2024年第2期12-18,共7页
针对目前已有抗菌肽(Antimicrobial Peptides,AMPs)预测模型的准确度(ACC)仍有待提高的问题,提出一种新的基于深度学习和蛋白质语言模型的抗菌肽预测模型DeepGlap,该模型分别采用两个蛋白质语言模型对抗菌肽序列进行特征提取,将提取的... 针对目前已有抗菌肽(Antimicrobial Peptides,AMPs)预测模型的准确度(ACC)仍有待提高的问题,提出一种新的基于深度学习和蛋白质语言模型的抗菌肽预测模型DeepGlap,该模型分别采用两个蛋白质语言模型对抗菌肽序列进行特征提取,将提取的特征向量融合后输入由多层双向长短记忆网络(mBi-LSTM)、一维卷积神经网络(1D-CNN)和注意力机制组成的深度学习网络中,并进行性能评估与优化。结果表明:该模型的ACC、皮尔逊相关系数(MCC)和曲线下的面积(AUC)分别为0.739、0.489和0.81,优于已有抗菌肽预测模型的预测效果。 展开更多
关键词 抗菌肽 预测模型 食源性病原体 蛋白质语言模型 深度学习网络
在线阅读 下载PDF
DeepSeek模型分析及其在AI辅助蛋白质工程中的应用 被引量:1
3
作者 李明辰 钟博子韬 +6 位作者 余元玺 姜帆 张良 谭扬 虞慧群 范贵生 洪亮 《合成生物学》 北大核心 2025年第3期636-650,共15页
2025年年初,杭州深度求索人工智能基础技术研究有限公司发布并开源了其自主研发的DeepSeek-R1对话大模型。该模型具备极低的推理成本和出色的思维链推理能力,在多种任务上能够媲美甚至超越闭源的GPT-4o和o1模型,引发了国际社会的高度关... 2025年年初,杭州深度求索人工智能基础技术研究有限公司发布并开源了其自主研发的DeepSeek-R1对话大模型。该模型具备极低的推理成本和出色的思维链推理能力,在多种任务上能够媲美甚至超越闭源的GPT-4o和o1模型,引发了国际社会的高度关注。此外,DeepSeek模型在中文对话上的优异表现以及免费商用的策略,在国内引发了部署和使用的热潮,推动了人工智能技术的普惠与发展。本文围绕DeepSeek模型的架构设计、训练方法与推理机制进行系统性分析,探讨其核心技术在AI蛋白质研究中的迁移潜力与应用前景。DeepSeek模型融合了多项自主创新的前沿技术,包括多头潜在注意力机制、混合专家网络及其负载均衡、低精度训练等,显著降低了Transformer模型的训练和推理成本。尽管DeepSeek模型原生设计用于人类语言的理解与生成,但其优化技术对同样基于Transformer模型的蛋白质预训练语言模型具有重要的参考价值。借助DeepSeek所采用的关键技术,蛋白质语言模型在训练成本、推理成本等方面有望得到显著降低。 展开更多
关键词 语言模型 AI蛋白质 深度自注意力变换网络 蛋白质语言模型 深度学习
在线阅读 下载PDF
T5MHCⅡ:基于深度学习的MHC-Ⅱ类蛋白质与多肽的亲和力预测模型
4
作者 高正 高向东 +1 位作者 姚文兵 田浤 《中国药科大学学报》 北大核心 2025年第3期368-375,共8页
为解决抗原肽与特定MHC-Ⅱ类分子的结合亲和力预测模型性能较低,无法满足临床需求的现状,提出一种基于深度学习的MHC-Ⅱ类分子与多肽亲和力的预测模型T5MHCⅡ。该模型通过迁移学习的方法,利用蛋白质语言模型ProtT5已学习到的知识对氨基... 为解决抗原肽与特定MHC-Ⅱ类分子的结合亲和力预测模型性能较低,无法满足临床需求的现状,提出一种基于深度学习的MHC-Ⅱ类分子与多肽亲和力的预测模型T5MHCⅡ。该模型通过迁移学习的方法,利用蛋白质语言模型ProtT5已学习到的知识对氨基酸序列进行特征提取,生成高质量的表征,并结合深度学习强大的学习能力,得到具有良好预测性能的新模型。五折交叉验证结果受试者工作特征曲线下的面积(AUC)为0.893±0.003,皮尔逊相关系数(PCC)为0.780±0.006,与NetMHCⅡpan-3.2、PUFFIN、DeepMHCⅡ和RPEMH相比性能更好;分子留一验证也展示了模型具有更好的泛化能力,该研究为使用深度学习方法在数据有限的情况下更准确地预测肽-MHCⅡ的亲和力提供了新的方法。 展开更多
关键词 主要组织相容性复合体 亲和力预测 深度学习 蛋白质语言模型
在线阅读 下载PDF
AlphaFold时代的蛋白质相关人工智能算法及其应用 被引量:2
5
作者 孙雨楠 叶川 赵东宇 《生理科学进展》 北大核心 2025年第3期202-209,共8页
蛋白质是生命活动的物质基础。蛋白质的功能取决于其空间结构,因此解析蛋白质的空间结构对于理解其功能至关重要。人工智能(artificial intelligence,AI)模型的利用极大地推进了蛋白质空间结构预测算法的开发,AlphaFold2是该领域里程碑... 蛋白质是生命活动的物质基础。蛋白质的功能取决于其空间结构,因此解析蛋白质的空间结构对于理解其功能至关重要。人工智能(artificial intelligence,AI)模型的利用极大地推进了蛋白质空间结构预测算法的开发,AlphaFold2是该领域里程碑式的成果,使得快速、准确且大规模的蛋白质空间结构预测成为可能。此外,蛋白质语言模型、蛋白质相互作用预测以及蛋白质设计等领域均在AlphaFold时代迎来快速发展,代表性的模型包括ESM2、ScanNet、RFdiffusion和RoseTTAFold-All Atom等。这些基于人工智能的新算法的开发极大地促进了蛋白质功能、诱发疾病的机制和药物设计等领域的研究。 展开更多
关键词 蛋白质结构预测 AlphaFold2 蛋白质语言模型 蛋白质相互作用预测 蛋白质设计
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部