相较于传统药物的研发,药物-靶标的预测方法能够有效降低成本,加快研发进程,但是在实际应用中存在数据集平衡度低、预测精确率不高等问题。基于此,提出一种自适应球形演化的药物-靶标相互作用预测方法ASEKELM(self-Adaptive Spherical E...相较于传统药物的研发,药物-靶标的预测方法能够有效降低成本,加快研发进程,但是在实际应用中存在数据集平衡度低、预测精确率不高等问题。基于此,提出一种自适应球形演化的药物-靶标相互作用预测方法ASEKELM(self-Adaptive Spherical Evolution based on Kernel Extreme Learning Machine)。该方法根据结构相似的药物与靶标更易存在相互作用的原理筛选出高置信度的负样本;并且为了解决球形演化算法易陷入局部最优的问题,利用搜索因子历史记忆的反馈机制及群大小线性递减的策略(LPSR),实现全局搜索和局部搜索的平衡,提高算法的寻优能力;然后利用自适应球形演化算法对核极限学习机(KELM)的参数进行优化。在基于黄金标准的数据集上将ASEKELM与NetLapRLS(Network Laplacian Regularized Least Square)、BLM-NII(Bipartite Local Model with Neighbor-based Interaction profile Inferring)等算法进行对比,验证算法的性能。实验结果表明,在酶(E)、G-蛋白偶联受体(GPCR)、离子通道(IC)和核受体(NR)数据集中,ASE-KELM的ROC曲线下面积(AUC)与PR曲线下面积(AUPR)均优于对比算法;且基于DrugBank等数据库,ASE-KELM在预测新药物-靶标对的验证过程中表现良好。展开更多
针对目前各种基于长短期记忆网络LSTM的句子情感分类方法没有考虑词的词性信息这一问题,将词性与自注意力机制相结合,提出一种面向句子情感分类的神经网络模型PALSTM(Pos and Attention-based LSTM).首先,结合预训练词向量和词性标注工...针对目前各种基于长短期记忆网络LSTM的句子情感分类方法没有考虑词的词性信息这一问题,将词性与自注意力机制相结合,提出一种面向句子情感分类的神经网络模型PALSTM(Pos and Attention-based LSTM).首先,结合预训练词向量和词性标注工具分别给出句子中词的语义词向量和词性词向量表示,并作为LSTM的输入用于学习词在内容和词性方面的长期依赖关系,有效地弥补了一般LSTM单纯依赖预训练词向量中词的共现信息的不足;接着,利用自注意力机制学习句子中词的位置信息和权重向量,并构造句子的最终语义表示;最后由多层感知器进行分类和输出.实验结果表明,PALSTM在公开语料库Movie Reviews、Internet Movie Database和Stanford Sentiment Treebank二元分类及五元情感上的准确率均比一般的LSTM和注意力LSTM模型有一定的提升.展开更多
目前基于注意力机制的句子属性情感分类方法由于忽略句子中属性的上下文信息以及单词与属性间的距离特征,从而导致注意力机制难以学习到合适的注意力权重.针对该问题,提出一种基于依存树及距离注意力的句子属性情感分类模型(dependency ...目前基于注意力机制的句子属性情感分类方法由于忽略句子中属性的上下文信息以及单词与属性间的距离特征,从而导致注意力机制难以学习到合适的注意力权重.针对该问题,提出一种基于依存树及距离注意力的句子属性情感分类模型(dependency tree and distance attention, DTDA).首先根据句子的依存树得到包含属性的依存子树,并利用双向GRU学习句子及属性的上下文特征表示;根据句子中单词和属性在依存树中的最短路径确定相应的语法距离及位置权重,同时结合相对距离构造包含语义信息和距离信息的句子特征表示,并进一步利用注意力机制生成属性相关的句子情感特征表示;最后,将句子的上下文信息与属性相关的情感特征表示合并后并通过softmax进行分类输出.实验结果表明:DTDA在国际语义评测SemEval2014的2个基准数据集Laptop和Restaurant上取得与目前最好方法相当的结果.当使用相关领域训练的词向量时,DTDA在Laptop上的精确率为77.01%,在Restaurant上的准确率为81.68%.展开更多
文摘相较于传统药物的研发,药物-靶标的预测方法能够有效降低成本,加快研发进程,但是在实际应用中存在数据集平衡度低、预测精确率不高等问题。基于此,提出一种自适应球形演化的药物-靶标相互作用预测方法ASEKELM(self-Adaptive Spherical Evolution based on Kernel Extreme Learning Machine)。该方法根据结构相似的药物与靶标更易存在相互作用的原理筛选出高置信度的负样本;并且为了解决球形演化算法易陷入局部最优的问题,利用搜索因子历史记忆的反馈机制及群大小线性递减的策略(LPSR),实现全局搜索和局部搜索的平衡,提高算法的寻优能力;然后利用自适应球形演化算法对核极限学习机(KELM)的参数进行优化。在基于黄金标准的数据集上将ASEKELM与NetLapRLS(Network Laplacian Regularized Least Square)、BLM-NII(Bipartite Local Model with Neighbor-based Interaction profile Inferring)等算法进行对比,验证算法的性能。实验结果表明,在酶(E)、G-蛋白偶联受体(GPCR)、离子通道(IC)和核受体(NR)数据集中,ASE-KELM的ROC曲线下面积(AUC)与PR曲线下面积(AUPR)均优于对比算法;且基于DrugBank等数据库,ASE-KELM在预测新药物-靶标对的验证过程中表现良好。
文摘针对目前各种基于长短期记忆网络LSTM的句子情感分类方法没有考虑词的词性信息这一问题,将词性与自注意力机制相结合,提出一种面向句子情感分类的神经网络模型PALSTM(Pos and Attention-based LSTM).首先,结合预训练词向量和词性标注工具分别给出句子中词的语义词向量和词性词向量表示,并作为LSTM的输入用于学习词在内容和词性方面的长期依赖关系,有效地弥补了一般LSTM单纯依赖预训练词向量中词的共现信息的不足;接着,利用自注意力机制学习句子中词的位置信息和权重向量,并构造句子的最终语义表示;最后由多层感知器进行分类和输出.实验结果表明,PALSTM在公开语料库Movie Reviews、Internet Movie Database和Stanford Sentiment Treebank二元分类及五元情感上的准确率均比一般的LSTM和注意力LSTM模型有一定的提升.
文摘目前基于注意力机制的句子属性情感分类方法由于忽略句子中属性的上下文信息以及单词与属性间的距离特征,从而导致注意力机制难以学习到合适的注意力权重.针对该问题,提出一种基于依存树及距离注意力的句子属性情感分类模型(dependency tree and distance attention, DTDA).首先根据句子的依存树得到包含属性的依存子树,并利用双向GRU学习句子及属性的上下文特征表示;根据句子中单词和属性在依存树中的最短路径确定相应的语法距离及位置权重,同时结合相对距离构造包含语义信息和距离信息的句子特征表示,并进一步利用注意力机制生成属性相关的句子情感特征表示;最后,将句子的上下文信息与属性相关的情感特征表示合并后并通过softmax进行分类输出.实验结果表明:DTDA在国际语义评测SemEval2014的2个基准数据集Laptop和Restaurant上取得与目前最好方法相当的结果.当使用相关领域训练的词向量时,DTDA在Laptop上的精确率为77.01%,在Restaurant上的准确率为81.68%.