针对基于图的无监督特征选择算法存在挖掘数据内在信息不充分,且易受噪声干扰难以获取更具有判别性特征的问题,提出一种基于广义不相关回归和潜在表示学习的无监督特征选择方法(uncorrelated regression and latent representation for ...针对基于图的无监督特征选择算法存在挖掘数据内在信息不充分,且易受噪声干扰难以获取更具有判别性特征的问题,提出一种基于广义不相关回归和潜在表示学习的无监督特征选择方法(uncorrelated regression and latent representation for unsupervised feature selection,URLUFS)。该方法将非负矩阵分解作用于广义不相关回归模型的投影矩阵,使投影矩阵实现非线性的维数约简并获得特征选择矩阵。在特征选择矩阵的基础上,引入自适应图学习来进一步挖掘数据的局部流形结构,并对特征选择矩阵施加范数约束以保持稀疏性。利用潜在表示对数据样本间的相互关系进行学习,引导回归模型中的伪标签矩阵,从而选择出更具有判别性的特征。在8个公开的数据集上进行了数值对比实验,实验结果表明:基于广义不相关回归和潜在表示学习的无监督特征选择算法明显优于其他8种无监督特征选择算法。展开更多
传统的知识图谱表示学习模型主要聚焦于三元组内部的结构信息,而未能充分利用外部语义增强嵌入表征能力,如没有充分考虑实体间的多步关系路径信息以及不同路径的重要程度,且没有利用实体描述信息增强上下文感知能力。为提升知识图谱的...传统的知识图谱表示学习模型主要聚焦于三元组内部的结构信息,而未能充分利用外部语义增强嵌入表征能力,如没有充分考虑实体间的多步关系路径信息以及不同路径的重要程度,且没有利用实体描述信息增强上下文感知能力。为提升知识图谱的应用效果,提出融合多步关系路径和实体描述信息的知识图谱表示学习(MPDRL)模型。首先,对两实体间的路径信息进行编码,并使用自注意力机制计算路径权重,从而获得关系路径信息的表示;其次,使用BERT(Bidirectional Encoder Representations from Transformers)模型对实体描述信息进行编码,并利用双向注意力机制计算实体描述信息嵌入与三元组关系嵌入之间的注意力权重,从而增强实体的语义信息;最后,将关系路径信息嵌入、实体描述信息嵌入和三元组结构嵌入融合起来进行训练。为评估模型性能,在公开数据集上针对所提模型和基准模型进行链接预测和三元组分类的实验。结果表明:在链接预测任务中,与融合关系路径与实体描述信息的知识图谱表示学习方法(PDRL)、多跳关系路径模型Att-ConvBiLSTM以及融合实体描述与关系路径信息的知识图谱嵌入模型TPKGE相比,所提模型在FB15k-237数据集上的Hit@10指标分别提高了5.7、2.9、2.5个百分点;在三元组分类任务上,所提模型在FB15k-237和WN18RR数据集上的准确率较最优基准模型PDRL分别提升了2.81和0.90个百分点。展开更多
文摘针对基于图的无监督特征选择算法存在挖掘数据内在信息不充分,且易受噪声干扰难以获取更具有判别性特征的问题,提出一种基于广义不相关回归和潜在表示学习的无监督特征选择方法(uncorrelated regression and latent representation for unsupervised feature selection,URLUFS)。该方法将非负矩阵分解作用于广义不相关回归模型的投影矩阵,使投影矩阵实现非线性的维数约简并获得特征选择矩阵。在特征选择矩阵的基础上,引入自适应图学习来进一步挖掘数据的局部流形结构,并对特征选择矩阵施加范数约束以保持稀疏性。利用潜在表示对数据样本间的相互关系进行学习,引导回归模型中的伪标签矩阵,从而选择出更具有判别性的特征。在8个公开的数据集上进行了数值对比实验,实验结果表明:基于广义不相关回归和潜在表示学习的无监督特征选择算法明显优于其他8种无监督特征选择算法。
文摘传统的知识图谱表示学习模型主要聚焦于三元组内部的结构信息,而未能充分利用外部语义增强嵌入表征能力,如没有充分考虑实体间的多步关系路径信息以及不同路径的重要程度,且没有利用实体描述信息增强上下文感知能力。为提升知识图谱的应用效果,提出融合多步关系路径和实体描述信息的知识图谱表示学习(MPDRL)模型。首先,对两实体间的路径信息进行编码,并使用自注意力机制计算路径权重,从而获得关系路径信息的表示;其次,使用BERT(Bidirectional Encoder Representations from Transformers)模型对实体描述信息进行编码,并利用双向注意力机制计算实体描述信息嵌入与三元组关系嵌入之间的注意力权重,从而增强实体的语义信息;最后,将关系路径信息嵌入、实体描述信息嵌入和三元组结构嵌入融合起来进行训练。为评估模型性能,在公开数据集上针对所提模型和基准模型进行链接预测和三元组分类的实验。结果表明:在链接预测任务中,与融合关系路径与实体描述信息的知识图谱表示学习方法(PDRL)、多跳关系路径模型Att-ConvBiLSTM以及融合实体描述与关系路径信息的知识图谱嵌入模型TPKGE相比,所提模型在FB15k-237数据集上的Hit@10指标分别提高了5.7、2.9、2.5个百分点;在三元组分类任务上,所提模型在FB15k-237和WN18RR数据集上的准确率较最优基准模型PDRL分别提升了2.81和0.90个百分点。