传统的知识图谱表示学习模型主要聚焦于三元组内部的结构信息,而未能充分利用外部语义增强嵌入表征能力,如没有充分考虑实体间的多步关系路径信息以及不同路径的重要程度,且没有利用实体描述信息增强上下文感知能力。为提升知识图谱的...传统的知识图谱表示学习模型主要聚焦于三元组内部的结构信息,而未能充分利用外部语义增强嵌入表征能力,如没有充分考虑实体间的多步关系路径信息以及不同路径的重要程度,且没有利用实体描述信息增强上下文感知能力。为提升知识图谱的应用效果,提出融合多步关系路径和实体描述信息的知识图谱表示学习(MPDRL)模型。首先,对两实体间的路径信息进行编码,并使用自注意力机制计算路径权重,从而获得关系路径信息的表示;其次,使用BERT(Bidirectional Encoder Representations from Transformers)模型对实体描述信息进行编码,并利用双向注意力机制计算实体描述信息嵌入与三元组关系嵌入之间的注意力权重,从而增强实体的语义信息;最后,将关系路径信息嵌入、实体描述信息嵌入和三元组结构嵌入融合起来进行训练。为评估模型性能,在公开数据集上针对所提模型和基准模型进行链接预测和三元组分类的实验。结果表明:在链接预测任务中,与融合关系路径与实体描述信息的知识图谱表示学习方法(PDRL)、多跳关系路径模型Att-ConvBiLSTM以及融合实体描述与关系路径信息的知识图谱嵌入模型TPKGE相比,所提模型在FB15k-237数据集上的Hit@10指标分别提高了5.7、2.9、2.5个百分点;在三元组分类任务上,所提模型在FB15k-237和WN18RR数据集上的准确率较最优基准模型PDRL分别提升了2.81和0.90个百分点。展开更多
时间序列分类是时间序列分析的基础。然而,现有的时间序列分类方法对应的形态特征并不能作为分类依据,且通道间的特征通过图上的单一权重刻画不够准确,导致分类精度不高。因此,提出一种融合衍生特征的时间序列事件分类方法(TSEC-FDF)。...时间序列分类是时间序列分析的基础。然而,现有的时间序列分类方法对应的形态特征并不能作为分类依据,且通道间的特征通过图上的单一权重刻画不够准确,导致分类精度不高。因此,提出一种融合衍生特征的时间序列事件分类方法(TSEC-FDF)。首先,在时间序列上构建时间序列事件集合后,根据每个时间序列事件构建突变图、协同图、启发图,以减少噪声对高维特征的干扰;其次,融合多图的特征作为衍生特征,并抽取时间序列事件的多个时间级别的特征;最后,提出一种融合衍生特征的多图卷积分类模型级联时间序列和图特征作为时间序列事件的高维特征。实验结果表明,与TF-C(Time-Frequency Consistency)和BiLSTM+隐马尔可夫模型(Bi-directional Long Short-Term Memory-Hidden Markov Model,BL-HMM)方法相比,TSEC-FDF在4个真实数据集上的准确率、精确率、查全率、F1值、AUROC(Area Under the Receiver Operating Characteristic curve)以及AUPRC(Area Under the Precision versus Recall Curve)至少提升了3.2%、4.7%、7.8%、6.3%、0.9%和2.2%。展开更多
文摘传统的知识图谱表示学习模型主要聚焦于三元组内部的结构信息,而未能充分利用外部语义增强嵌入表征能力,如没有充分考虑实体间的多步关系路径信息以及不同路径的重要程度,且没有利用实体描述信息增强上下文感知能力。为提升知识图谱的应用效果,提出融合多步关系路径和实体描述信息的知识图谱表示学习(MPDRL)模型。首先,对两实体间的路径信息进行编码,并使用自注意力机制计算路径权重,从而获得关系路径信息的表示;其次,使用BERT(Bidirectional Encoder Representations from Transformers)模型对实体描述信息进行编码,并利用双向注意力机制计算实体描述信息嵌入与三元组关系嵌入之间的注意力权重,从而增强实体的语义信息;最后,将关系路径信息嵌入、实体描述信息嵌入和三元组结构嵌入融合起来进行训练。为评估模型性能,在公开数据集上针对所提模型和基准模型进行链接预测和三元组分类的实验。结果表明:在链接预测任务中,与融合关系路径与实体描述信息的知识图谱表示学习方法(PDRL)、多跳关系路径模型Att-ConvBiLSTM以及融合实体描述与关系路径信息的知识图谱嵌入模型TPKGE相比,所提模型在FB15k-237数据集上的Hit@10指标分别提高了5.7、2.9、2.5个百分点;在三元组分类任务上,所提模型在FB15k-237和WN18RR数据集上的准确率较最优基准模型PDRL分别提升了2.81和0.90个百分点。
文摘时间序列分类是时间序列分析的基础。然而,现有的时间序列分类方法对应的形态特征并不能作为分类依据,且通道间的特征通过图上的单一权重刻画不够准确,导致分类精度不高。因此,提出一种融合衍生特征的时间序列事件分类方法(TSEC-FDF)。首先,在时间序列上构建时间序列事件集合后,根据每个时间序列事件构建突变图、协同图、启发图,以减少噪声对高维特征的干扰;其次,融合多图的特征作为衍生特征,并抽取时间序列事件的多个时间级别的特征;最后,提出一种融合衍生特征的多图卷积分类模型级联时间序列和图特征作为时间序列事件的高维特征。实验结果表明,与TF-C(Time-Frequency Consistency)和BiLSTM+隐马尔可夫模型(Bi-directional Long Short-Term Memory-Hidden Markov Model,BL-HMM)方法相比,TSEC-FDF在4个真实数据集上的准确率、精确率、查全率、F1值、AUROC(Area Under the Receiver Operating Characteristic curve)以及AUPRC(Area Under the Precision versus Recall Curve)至少提升了3.2%、4.7%、7.8%、6.3%、0.9%和2.2%。