蛋白质关系抽取研究对于生命科学各领域的研究具有广泛的应用价值。但是,基于机器学习的蛋白质关系抽取方法普遍停留在二元关系抽取,失去了丰富的关系类型信息,而基于规则的开放式信息抽取方法可以抽取完整的蛋白质关系("蛋白质1,...蛋白质关系抽取研究对于生命科学各领域的研究具有广泛的应用价值。但是,基于机器学习的蛋白质关系抽取方法普遍停留在二元关系抽取,失去了丰富的关系类型信息,而基于规则的开放式信息抽取方法可以抽取完整的蛋白质关系("蛋白质1,关系词,蛋白质2"),但是召回率较低。针对以上问题,该文提出了一种混合机器学习和规则方法的蛋白质关系抽取框架。该框架先利用机器学习方法完成命名实体识别和二元关系抽取,然后利用基于句法模板和词典匹配的方法抽取表示当前两个蛋白质间关系类型的关系词。该方法在AImed语料上取得了40.18%的F值,远高于基于规则的Stanford Open IE方法。展开更多
化学物与蛋白质之间的相互作用关系抽取对精准医学和药物发现等方面的研究有着重要作用。该文提出了一种基于最短依存路径和注意力机制的双向LSTM模型,并将其应用于化学物蛋白质关系抽取。在特征上综合考虑了最短依存路径上的词性、位...化学物与蛋白质之间的相互作用关系抽取对精准医学和药物发现等方面的研究有着重要作用。该文提出了一种基于最短依存路径和注意力机制的双向LSTM模型,并将其应用于化学物蛋白质关系抽取。在特征上综合考虑了最短依存路径上的词性、位置和依存关系类型等。在BioCreative VI CHEMPROT任务上的实验表明,该方法在基于依存信息的系统中获得了较好的F1值性能。同时,集成学习也进一步提高了化学物蛋白质关系抽取性能。展开更多
考虑到不同类型的相互作用对于功能预测的作用各不相同,结合蛋白质相互作用网络和蛋白质结构域信息构建多关系蛋白质网络,并为每种类型的相互作用赋予不同的遍历优先级.基于多关系网络,提出一种蛋白质功能预测方法 FPM(Functions predic...考虑到不同类型的相互作用对于功能预测的作用各不相同,结合蛋白质相互作用网络和蛋白质结构域信息构建多关系蛋白质网络,并为每种类型的相互作用赋予不同的遍历优先级.基于多关系网络,提出一种蛋白质功能预测方法 FPM(Functions prediction based on multi-relational networks).对于未注释的蛋白质,算法遍历与该蛋白质相连的,具有最高优先级的所有相互作用,形成一个候选邻居节点集合.最后根据邻居节点集合形成预测的功能集合,并为每一项功能评分、排序.与其他算法对比结果表明,FPM方法的性能优于其他的功能预测方法.展开更多
文摘蛋白质关系抽取研究对于生命科学各领域的研究具有广泛的应用价值。但是,基于机器学习的蛋白质关系抽取方法普遍停留在二元关系抽取,失去了丰富的关系类型信息,而基于规则的开放式信息抽取方法可以抽取完整的蛋白质关系("蛋白质1,关系词,蛋白质2"),但是召回率较低。针对以上问题,该文提出了一种混合机器学习和规则方法的蛋白质关系抽取框架。该框架先利用机器学习方法完成命名实体识别和二元关系抽取,然后利用基于句法模板和词典匹配的方法抽取表示当前两个蛋白质间关系类型的关系词。该方法在AImed语料上取得了40.18%的F值,远高于基于规则的Stanford Open IE方法。
文摘化学物与蛋白质之间的相互作用关系抽取对精准医学和药物发现等方面的研究有着重要作用。该文提出了一种基于最短依存路径和注意力机制的双向LSTM模型,并将其应用于化学物蛋白质关系抽取。在特征上综合考虑了最短依存路径上的词性、位置和依存关系类型等。在BioCreative VI CHEMPROT任务上的实验表明,该方法在基于依存信息的系统中获得了较好的F1值性能。同时,集成学习也进一步提高了化学物蛋白质关系抽取性能。
文摘考虑到不同类型的相互作用对于功能预测的作用各不相同,结合蛋白质相互作用网络和蛋白质结构域信息构建多关系蛋白质网络,并为每种类型的相互作用赋予不同的遍历优先级.基于多关系网络,提出一种蛋白质功能预测方法 FPM(Functions prediction based on multi-relational networks).对于未注释的蛋白质,算法遍历与该蛋白质相连的,具有最高优先级的所有相互作用,形成一个候选邻居节点集合.最后根据邻居节点集合形成预测的功能集合,并为每一项功能评分、排序.与其他算法对比结果表明,FPM方法的性能优于其他的功能预测方法.