-
题名基于弱语义样本的对比学习句嵌入方法
- 1
-
-
作者
徐斌斌
严大川
王建尚
王小敏
-
机构
兰州交通大学电子与信息工程学院
-
出处
《兰州交通大学学报》
CAS
2024年第1期51-58,共8页
-
文摘
为了有效消除句嵌入在语义特征空间的各向异性问题,提出一种基于弱语义样本的对比学习句嵌入方法,旨在生成有效句嵌入的同时,提升模型对文本语义相似性的识别效果。首先,采用标记重复算法构建相似样本并作为遮掩语言模型的输入,预测生成包含弱语义关系的样本;然后,将原始样本重复输入不同失活率的转换器,抽取不同的全局语义特征;最后,通过对比学习调整特征权重值,构建句嵌入。在公开数据集上进行系列对比实验,结果表明:基于弱语义样本的句嵌入表示方法性能优于其他方法,获得77.38%的相似性评估分数,为句嵌入生成和语义相似度识别任务提供了一种有效的解决方案。
-
关键词
句嵌入
对比学习
弱语义样本
文本相似性
-
Keywords
sentence embeddings
contrastive learning
weak semantic samples
textual semantic similarity
-
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
-