期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Transformer和门控循环单元的肽序列理论串联质谱图预测方法
1
作者
何长久
杨婧涵
+5 位作者
周丕宇
边昕烨
吕明明
董迪
付岩
王海鹏
《计算机应用》
CSCD
北大核心
2024年第12期3958-3964,共7页
针对现有理论串联质谱图预测仅限于预测b、y主干碎片离子以及单一模型难以捕捉肽序列复杂关系的问题,提出一种基于Transformer和门控循环单元(GRU)的肽序列理论串联质谱图预测方法,名为DeepCollider。首先,通过自注意力机制和长距离依...
针对现有理论串联质谱图预测仅限于预测b、y主干碎片离子以及单一模型难以捕捉肽序列复杂关系的问题,提出一种基于Transformer和门控循环单元(GRU)的肽序列理论串联质谱图预测方法,名为DeepCollider。首先,通过自注意力机制和长距离依赖关系,使用Transformer和GRU结合的深度学习架构增强对肽序列与碎片离子强度关系的建模能力;其次,与现有方法编码肽序列预测所有b、y主干离子不同,使用碎裂标志位标记肽序列的碎裂位点,从而可针对特定碎裂位点进行编码并预测相应的碎片离子;最后,为了计算预测谱图与实验谱图之间的相似度,使用皮尔逊相关系数(PCC)和平均绝对误差(MAE)作为评测指标。实验结果表明,与现有的仅限预测b、y主干碎片离子的方法(如pDeep和Prosit方法)相比,DeepCollider在PCC和MAE指标上均有优势,PCC值提升了0.15,MAE值降低了0.005。可见,DeepCollider不仅可以预测b、y、a主干离子及其相应的失水失氨中性丢失离子,还可以进一步提高理论谱图预测的谱峰覆盖度和相似性。
展开更多
关键词
理论质谱图预测
肽序列
碎片离子强度
蛋白质组学
深度学习
在线阅读
下载PDF
职称材料
基于数据非依赖采集的蛋白质组质谱数据解析方法研究进展
被引量:
4
2
作者
侯鑫行
周丕宇
+3 位作者
宫鹏云
付嘉乐
刘超
王海鹏
《生物化学与生物物理进展》
SCIE
CAS
CSCD
北大核心
2022年第12期2364-2386,共23页
数据非依赖采集(DIA)是蛋白质组学领域近年来快速发展的质谱采集技术,其通过无偏碎裂隔离窗口内的所有母离子采集二级谱图,理论上可实现蛋白质样品的深度覆盖,同时具有高通量、高重现性和高灵敏度的优点。现有的DIA数据采集方法可以分...
数据非依赖采集(DIA)是蛋白质组学领域近年来快速发展的质谱采集技术,其通过无偏碎裂隔离窗口内的所有母离子采集二级谱图,理论上可实现蛋白质样品的深度覆盖,同时具有高通量、高重现性和高灵敏度的优点。现有的DIA数据采集方法可以分为全窗口碎裂方法、隔离窗口序列碎裂方法和四维DIA数据采集方法(4D-DIA)3大类。针对DIA数据的不同特点,主要数据解析方法包括谱库搜索方法、蛋白质序列库直接搜索方法、伪二级谱图鉴定方法和从头测序方法4大类。解析得到的肽段鉴定结果需要进行可信度评估,包括使用机器学习方法的重排序和对报告结果集合的假发现率估计两个步骤,实现对数据解析结果的质控。本文对DIA数据的采集方法、数据解析方法及软件和鉴定结果可信度评估方法进行了整理和综述,并展望了未来的发展方向。
展开更多
关键词
蛋白质组学
数据非依赖采集
质谱
靶向数据提取
在线阅读
下载PDF
职称材料
基于图卷积神经网络的串联质谱从头测序
被引量:
3
3
作者
牟长宁
王海鹏
+1 位作者
周丕宇
侯鑫行
《计算机应用》
CSCD
北大核心
2021年第9期2773-2779,共7页
在蛋白质组学中从头测序是串联质谱肽段测序的重要方法之一,其具有不依赖于蛋白质数据库的优势,并在测定未知物种蛋白序列、单克隆抗体测序等领域中起着关键作用。然而由于从头测序的复杂性,导致其测序的准确率远低于数据库搜索方法,制...
在蛋白质组学中从头测序是串联质谱肽段测序的重要方法之一,其具有不依赖于蛋白质数据库的优势,并在测定未知物种蛋白序列、单克隆抗体测序等领域中起着关键作用。然而由于从头测序的复杂性,导致其测序的准确率远低于数据库搜索方法,制约了从头测序的广泛应用。针对从头测序准确率低的问题,提出一种基于图卷积神经网络(GCN)的从头测序方法denovo-GCN。该方法将质谱中谱峰之间的关系用图结构表示,并从每个相应的肽碎裂位点提取谱峰特征,然后通过GCN预测当前碎裂位点处的氨基酸类型,最后逐步组成完整的肽序列。通过实验确定了GCN模型的层数、离子类型组合和测序使用的谱峰数量这3个影响模型的重要参数,并将多个物种数据集用于实验对比。实验结果表明,该方法在肽水平上的召回率比基于图论的从头测序方法Novor、pNovo提高了4.0~21.1个百分点,比基于卷积神经网络(CNN)和长短期记忆(LSTM)网络的DeepNovo提高了2.1~10.7个百分点。
展开更多
关键词
图卷积神经网络
从头测序
蛋白质组学
串联质谱
在线阅读
下载PDF
职称材料
题名
基于Transformer和门控循环单元的肽序列理论串联质谱图预测方法
1
作者
何长久
杨婧涵
周丕宇
边昕烨
吕明明
董迪
付岩
王海鹏
机构
山东理工大学计算机科学与技术学院
中国科学院数学与系统科学研究院
出处
《计算机应用》
CSCD
北大核心
2024年第12期3958-3964,共7页
基金
国家重点研发计划项目(2022YFA1304603)
山东省高等学校优秀青年创新团队支持计划项目(2019KJN048)。
文摘
针对现有理论串联质谱图预测仅限于预测b、y主干碎片离子以及单一模型难以捕捉肽序列复杂关系的问题,提出一种基于Transformer和门控循环单元(GRU)的肽序列理论串联质谱图预测方法,名为DeepCollider。首先,通过自注意力机制和长距离依赖关系,使用Transformer和GRU结合的深度学习架构增强对肽序列与碎片离子强度关系的建模能力;其次,与现有方法编码肽序列预测所有b、y主干离子不同,使用碎裂标志位标记肽序列的碎裂位点,从而可针对特定碎裂位点进行编码并预测相应的碎片离子;最后,为了计算预测谱图与实验谱图之间的相似度,使用皮尔逊相关系数(PCC)和平均绝对误差(MAE)作为评测指标。实验结果表明,与现有的仅限预测b、y主干碎片离子的方法(如pDeep和Prosit方法)相比,DeepCollider在PCC和MAE指标上均有优势,PCC值提升了0.15,MAE值降低了0.005。可见,DeepCollider不仅可以预测b、y、a主干离子及其相应的失水失氨中性丢失离子,还可以进一步提高理论谱图预测的谱峰覆盖度和相似性。
关键词
理论质谱图预测
肽序列
碎片离子强度
蛋白质组学
深度学习
Keywords
theoretical mass spectrometry prediction
peptide sequence
fragment ion intensity
proteomics
deep learning
分类号
TP391.9 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于数据非依赖采集的蛋白质组质谱数据解析方法研究进展
被引量:
4
2
作者
侯鑫行
周丕宇
宫鹏云
付嘉乐
刘超
王海鹏
机构
山东理工大学计算机科学与技术学院
北京航空航天大学医学科学与工程学院&生物与医学工程学院
清华大学生命科学学院
出处
《生物化学与生物物理进展》
SCIE
CAS
CSCD
北大核心
2022年第12期2364-2386,共23页
基金
山东省高等学校优秀青年创新团队支持计划(2019KJN048)
国家自然科学基金(31500669)资助项目。
文摘
数据非依赖采集(DIA)是蛋白质组学领域近年来快速发展的质谱采集技术,其通过无偏碎裂隔离窗口内的所有母离子采集二级谱图,理论上可实现蛋白质样品的深度覆盖,同时具有高通量、高重现性和高灵敏度的优点。现有的DIA数据采集方法可以分为全窗口碎裂方法、隔离窗口序列碎裂方法和四维DIA数据采集方法(4D-DIA)3大类。针对DIA数据的不同特点,主要数据解析方法包括谱库搜索方法、蛋白质序列库直接搜索方法、伪二级谱图鉴定方法和从头测序方法4大类。解析得到的肽段鉴定结果需要进行可信度评估,包括使用机器学习方法的重排序和对报告结果集合的假发现率估计两个步骤,实现对数据解析结果的质控。本文对DIA数据的采集方法、数据解析方法及软件和鉴定结果可信度评估方法进行了整理和综述,并展望了未来的发展方向。
关键词
蛋白质组学
数据非依赖采集
质谱
靶向数据提取
Keywords
proteomics
data independent acquisition
mass spectrometry
targeted data extraction
分类号
Q51 [生物学—生物化学]
TP39 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于图卷积神经网络的串联质谱从头测序
被引量:
3
3
作者
牟长宁
王海鹏
周丕宇
侯鑫行
机构
山东理工大学计算机科学与技术学院
出处
《计算机应用》
CSCD
北大核心
2021年第9期2773-2779,共7页
基金
国家自然科学基金资助项目(31500669)
山东省自然科学基金资助项目(ZR2014FQ024)
山东省高等学校优秀青年创新团队支持计划项目(2019KJN048)。
文摘
在蛋白质组学中从头测序是串联质谱肽段测序的重要方法之一,其具有不依赖于蛋白质数据库的优势,并在测定未知物种蛋白序列、单克隆抗体测序等领域中起着关键作用。然而由于从头测序的复杂性,导致其测序的准确率远低于数据库搜索方法,制约了从头测序的广泛应用。针对从头测序准确率低的问题,提出一种基于图卷积神经网络(GCN)的从头测序方法denovo-GCN。该方法将质谱中谱峰之间的关系用图结构表示,并从每个相应的肽碎裂位点提取谱峰特征,然后通过GCN预测当前碎裂位点处的氨基酸类型,最后逐步组成完整的肽序列。通过实验确定了GCN模型的层数、离子类型组合和测序使用的谱峰数量这3个影响模型的重要参数,并将多个物种数据集用于实验对比。实验结果表明,该方法在肽水平上的召回率比基于图论的从头测序方法Novor、pNovo提高了4.0~21.1个百分点,比基于卷积神经网络(CNN)和长短期记忆(LSTM)网络的DeepNovo提高了2.1~10.7个百分点。
关键词
图卷积神经网络
从头测序
蛋白质组学
串联质谱
Keywords
Graph Convolutional neural Network(GCN)
de novo sequencing
proteomics
tandem mass spectrometry
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Transformer和门控循环单元的肽序列理论串联质谱图预测方法
何长久
杨婧涵
周丕宇
边昕烨
吕明明
董迪
付岩
王海鹏
《计算机应用》
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
2
基于数据非依赖采集的蛋白质组质谱数据解析方法研究进展
侯鑫行
周丕宇
宫鹏云
付嘉乐
刘超
王海鹏
《生物化学与生物物理进展》
SCIE
CAS
CSCD
北大核心
2022
4
在线阅读
下载PDF
职称材料
3
基于图卷积神经网络的串联质谱从头测序
牟长宁
王海鹏
周丕宇
侯鑫行
《计算机应用》
CSCD
北大核心
2021
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部