传统的知识图谱表示学习模型主要聚焦于三元组内部的结构信息,而未能充分利用外部语义增强嵌入表征能力,如没有充分考虑实体间的多步关系路径信息以及不同路径的重要程度,且没有利用实体描述信息增强上下文感知能力。为提升知识图谱的...传统的知识图谱表示学习模型主要聚焦于三元组内部的结构信息,而未能充分利用外部语义增强嵌入表征能力,如没有充分考虑实体间的多步关系路径信息以及不同路径的重要程度,且没有利用实体描述信息增强上下文感知能力。为提升知识图谱的应用效果,提出融合多步关系路径和实体描述信息的知识图谱表示学习(MPDRL)模型。首先,对两实体间的路径信息进行编码,并使用自注意力机制计算路径权重,从而获得关系路径信息的表示;其次,使用BERT(Bidirectional Encoder Representations from Transformers)模型对实体描述信息进行编码,并利用双向注意力机制计算实体描述信息嵌入与三元组关系嵌入之间的注意力权重,从而增强实体的语义信息;最后,将关系路径信息嵌入、实体描述信息嵌入和三元组结构嵌入融合起来进行训练。为评估模型性能,在公开数据集上针对所提模型和基准模型进行链接预测和三元组分类的实验。结果表明:在链接预测任务中,与融合关系路径与实体描述信息的知识图谱表示学习方法(PDRL)、多跳关系路径模型Att-ConvBiLSTM以及融合实体描述与关系路径信息的知识图谱嵌入模型TPKGE相比,所提模型在FB15k-237数据集上的Hit@10指标分别提高了5.7、2.9、2.5个百分点;在三元组分类任务上,所提模型在FB15k-237和WN18RR数据集上的准确率较最优基准模型PDRL分别提升了2.81和0.90个百分点。展开更多
气温作为研究气候演变最基础的物理量,其日值序列的完整性和准确性对于气候分析与评估工作有着重要意义。近些年随着大量无人值守地面加密自动气象站的布设,不断出现随机站点和随机长度这种双随机特点的气象资料序列缺失,给气候分析和...气温作为研究气候演变最基础的物理量,其日值序列的完整性和准确性对于气候分析与评估工作有着重要意义。近些年随着大量无人值守地面加密自动气象站的布设,不断出现随机站点和随机长度这种双随机特点的气象资料序列缺失,给气候分析和业务应用造成了不小的障碍。针对现有气象数据插补方案的不足,提出了一种全新的基于动态时间规整(dynamic time warping,DTW)的气温日值数据二次插补方法。该方法采用了一种实时的插补策略,主要技术内容包括:1)利用一元线性回归方程将原始气温观测时间序列分解出拟合直线和残差曲线,并将二者重构组成新的气温序列;2)给出了气温插补区的定义和插补条件;3)提出了利用动态时间规整方法计算站点间距离的新模式。利用山东省2021年的气温实况数据对该方法进行了双随机检验,检验结果表明:该方法可以满足日平均气温、日最高气温和日最低气温数据的插补需求;在插补流程中采用DTW距离测度和二次插补的组合方法,其插补效果优于目前常见的基于站点地理临近关系的组合方法;该方法对地形有一定的敏感性,平原或丘陵地区的插补效果要优于山地地区。展开更多
文摘传统的知识图谱表示学习模型主要聚焦于三元组内部的结构信息,而未能充分利用外部语义增强嵌入表征能力,如没有充分考虑实体间的多步关系路径信息以及不同路径的重要程度,且没有利用实体描述信息增强上下文感知能力。为提升知识图谱的应用效果,提出融合多步关系路径和实体描述信息的知识图谱表示学习(MPDRL)模型。首先,对两实体间的路径信息进行编码,并使用自注意力机制计算路径权重,从而获得关系路径信息的表示;其次,使用BERT(Bidirectional Encoder Representations from Transformers)模型对实体描述信息进行编码,并利用双向注意力机制计算实体描述信息嵌入与三元组关系嵌入之间的注意力权重,从而增强实体的语义信息;最后,将关系路径信息嵌入、实体描述信息嵌入和三元组结构嵌入融合起来进行训练。为评估模型性能,在公开数据集上针对所提模型和基准模型进行链接预测和三元组分类的实验。结果表明:在链接预测任务中,与融合关系路径与实体描述信息的知识图谱表示学习方法(PDRL)、多跳关系路径模型Att-ConvBiLSTM以及融合实体描述与关系路径信息的知识图谱嵌入模型TPKGE相比,所提模型在FB15k-237数据集上的Hit@10指标分别提高了5.7、2.9、2.5个百分点;在三元组分类任务上,所提模型在FB15k-237和WN18RR数据集上的准确率较最优基准模型PDRL分别提升了2.81和0.90个百分点。
文摘气温作为研究气候演变最基础的物理量,其日值序列的完整性和准确性对于气候分析与评估工作有着重要意义。近些年随着大量无人值守地面加密自动气象站的布设,不断出现随机站点和随机长度这种双随机特点的气象资料序列缺失,给气候分析和业务应用造成了不小的障碍。针对现有气象数据插补方案的不足,提出了一种全新的基于动态时间规整(dynamic time warping,DTW)的气温日值数据二次插补方法。该方法采用了一种实时的插补策略,主要技术内容包括:1)利用一元线性回归方程将原始气温观测时间序列分解出拟合直线和残差曲线,并将二者重构组成新的气温序列;2)给出了气温插补区的定义和插补条件;3)提出了利用动态时间规整方法计算站点间距离的新模式。利用山东省2021年的气温实况数据对该方法进行了双随机检验,检验结果表明:该方法可以满足日平均气温、日最高气温和日最低气温数据的插补需求;在插补流程中采用DTW距离测度和二次插补的组合方法,其插补效果优于目前常见的基于站点地理临近关系的组合方法;该方法对地形有一定的敏感性,平原或丘陵地区的插补效果要优于山地地区。