当前,AI大模型逐渐被应用于蛋白质科学和生物信息学中,但其复杂性常常使人们无法解释神经网络如何从复杂的生物数据中提取和理解关键特征.为了理解这类计算模型如何拥有推断生物大分子的结构、功能和相互作用的能力,在前人关于预测治疗...当前,AI大模型逐渐被应用于蛋白质科学和生物信息学中,但其复杂性常常使人们无法解释神经网络如何从复杂的生物数据中提取和理解关键特征.为了理解这类计算模型如何拥有推断生物大分子的结构、功能和相互作用的能力,在前人关于预测治疗性抗体结合特异性的研究基础上进一步拓展,提出了基于通道注意力机制可解释的残差卷积神经网络.该网络能够有效预测具有不同氨基酸序列的抗体特异性结合概率,网络交叉验证的AUC(Area under Curve)达到0.943,与传统方法相比有显著提高.其次,通过非线性变换和积分梯度的方法获得各位点对于结合能力的贡献,从而推断出抗体序列的残基分布模式.提出的方法可以获得氨基酸序列背后潜在的信息,也能显著减小特异性抗体预测未知的突变空间,证明该网络不仅性能更优,对于理解复杂的神经网络背后的逻辑也有所帮助.展开更多
时间序列相似检测在金融数据、电力数据挖掘等场景都有很重要的作用。为了解决时间序列深度哈希网络存在哈希量化损失的问题,提出一种端到端的深度对比学习时间序列哈希网络(Deep Contrastive Time Series Hash,DCTSH)。通过引入自适应...时间序列相似检测在金融数据、电力数据挖掘等场景都有很重要的作用。为了解决时间序列深度哈希网络存在哈希量化损失的问题,提出一种端到端的深度对比学习时间序列哈希网络(Deep Contrastive Time Series Hash,DCTSH)。通过引入自适应二值化网络与哈希损失,消除二值化哈希时的量化误差,使得模型端到端训练生成的时间序列哈希编码,具有更好的表达效果与泛化能力。针对无标签时间序列数据,通过聚类改进对比学习网络的负样本选择来增强时间序列表示学习能力。在多个时间序列数据集上实验结果表明,DCTSH相较于之前的方法检测精度显著提升。展开更多
在实际监测任务中,及时有效地识别飞行模式至关重要。然而,现有的飞行模式识别方法主观性强、模式单一,限制了在复杂情况下的飞行监控能力,在实际应用中有局限性,进而导致模式边界定位不精确、识别精度低。为此提出一种基于敏感边界和...在实际监测任务中,及时有效地识别飞行模式至关重要。然而,现有的飞行模式识别方法主观性强、模式单一,限制了在复杂情况下的飞行监控能力,在实际应用中有局限性,进而导致模式边界定位不精确、识别精度低。为此提出一种基于敏感边界和长飞行序列的飞行模式智能识别方法(Intelligent Flight Pattern Recognition Method for Sensitive Boundaries and Long Flight Sequences, IFPRM-SBLFS),以对飞行模式进行智能识别。为了更好地探索多模式飞行参数的空间关系,设计自适应图嵌入,针对不同持续时间的飞行模式提出去噪深度多尺度自动编码器,以及用于减轻模型损失的分类加权焦点损失和回归联合时空交集损失。为验证所提方法的优越性,采集多架民用航班的真实参数,涵盖11种飞行模式,通过人工标注构建飞行模式数据集。仿真计算结果表明:新模型能够在连续飞行架次中自动区分不同的飞行模式,并准确提取模式边界,识别准确率达到了99.07%,且无需任何预处理或后处理;新的智能识别方法可以有效提高精确度和敏感边界的飞行模式识别效果。展开更多
长期时间序列预测利用历史数据对未来较远时段的序列走势进行预测,为长期预警、规划和决策提供支持。现有方法在进行长期预测时,普遍存在分布偏移和长期依赖关系难以捕获的问题。提出一种面向长期时间序列预测的多项式投影与信息交换架...长期时间序列预测利用历史数据对未来较远时段的序列走势进行预测,为长期预警、规划和决策提供支持。现有方法在进行长期预测时,普遍存在分布偏移和长期依赖关系难以捕获的问题。提出一种面向长期时间序列预测的多项式投影与信息交换架构LPPIEA(Legendre polynomial projection and information exchange architecture)。引入可逆实例数据归一化,降低长期时间序列中分布偏移对预测的影响。使用勒让德多项式投影来处理复杂的时间模式,获取数据的高维特征表示以增强模型推理长期时间序列的能力。为了有效捕获长期时间依赖关系,构建轻量化的信息交换架构来高效捕获长期时间依赖关系,从而实现准确高效的长期时间序列预测。在4个常用的公开数据集上的实验结果表明,LPPIEA的预测误差相比于基线方法平均降低11.4%,同时还具有较高的计算效率。展开更多
文摘当前,AI大模型逐渐被应用于蛋白质科学和生物信息学中,但其复杂性常常使人们无法解释神经网络如何从复杂的生物数据中提取和理解关键特征.为了理解这类计算模型如何拥有推断生物大分子的结构、功能和相互作用的能力,在前人关于预测治疗性抗体结合特异性的研究基础上进一步拓展,提出了基于通道注意力机制可解释的残差卷积神经网络.该网络能够有效预测具有不同氨基酸序列的抗体特异性结合概率,网络交叉验证的AUC(Area under Curve)达到0.943,与传统方法相比有显著提高.其次,通过非线性变换和积分梯度的方法获得各位点对于结合能力的贡献,从而推断出抗体序列的残基分布模式.提出的方法可以获得氨基酸序列背后潜在的信息,也能显著减小特异性抗体预测未知的突变空间,证明该网络不仅性能更优,对于理解复杂的神经网络背后的逻辑也有所帮助.
文摘时间序列相似检测在金融数据、电力数据挖掘等场景都有很重要的作用。为了解决时间序列深度哈希网络存在哈希量化损失的问题,提出一种端到端的深度对比学习时间序列哈希网络(Deep Contrastive Time Series Hash,DCTSH)。通过引入自适应二值化网络与哈希损失,消除二值化哈希时的量化误差,使得模型端到端训练生成的时间序列哈希编码,具有更好的表达效果与泛化能力。针对无标签时间序列数据,通过聚类改进对比学习网络的负样本选择来增强时间序列表示学习能力。在多个时间序列数据集上实验结果表明,DCTSH相较于之前的方法检测精度显著提升。
文摘在实际监测任务中,及时有效地识别飞行模式至关重要。然而,现有的飞行模式识别方法主观性强、模式单一,限制了在复杂情况下的飞行监控能力,在实际应用中有局限性,进而导致模式边界定位不精确、识别精度低。为此提出一种基于敏感边界和长飞行序列的飞行模式智能识别方法(Intelligent Flight Pattern Recognition Method for Sensitive Boundaries and Long Flight Sequences, IFPRM-SBLFS),以对飞行模式进行智能识别。为了更好地探索多模式飞行参数的空间关系,设计自适应图嵌入,针对不同持续时间的飞行模式提出去噪深度多尺度自动编码器,以及用于减轻模型损失的分类加权焦点损失和回归联合时空交集损失。为验证所提方法的优越性,采集多架民用航班的真实参数,涵盖11种飞行模式,通过人工标注构建飞行模式数据集。仿真计算结果表明:新模型能够在连续飞行架次中自动区分不同的飞行模式,并准确提取模式边界,识别准确率达到了99.07%,且无需任何预处理或后处理;新的智能识别方法可以有效提高精确度和敏感边界的飞行模式识别效果。
文摘长期时间序列预测利用历史数据对未来较远时段的序列走势进行预测,为长期预警、规划和决策提供支持。现有方法在进行长期预测时,普遍存在分布偏移和长期依赖关系难以捕获的问题。提出一种面向长期时间序列预测的多项式投影与信息交换架构LPPIEA(Legendre polynomial projection and information exchange architecture)。引入可逆实例数据归一化,降低长期时间序列中分布偏移对预测的影响。使用勒让德多项式投影来处理复杂的时间模式,获取数据的高维特征表示以增强模型推理长期时间序列的能力。为了有效捕获长期时间依赖关系,构建轻量化的信息交换架构来高效捕获长期时间依赖关系,从而实现准确高效的长期时间序列预测。在4个常用的公开数据集上的实验结果表明,LPPIEA的预测误差相比于基线方法平均降低11.4%,同时还具有较高的计算效率。