期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于改进蒸馏学习的医学文本相似度计算
1
作者 关慧 赵凌波 杨伟琛 《计算机工程与设计》 2025年第9期2473-2479,共7页
针对医学领域文本相似度计算存在的样本少、领域词多、学习效率低的问题,提出一种结合医学领域词嵌入和掩码语言模型的数据增强方法,并基于细粒度蒸馏思想提出一种结合中心核对齐算法的蒸馏模型。将原始医学数据集利用数据增强方法进行... 针对医学领域文本相似度计算存在的样本少、领域词多、学习效率低的问题,提出一种结合医学领域词嵌入和掩码语言模型的数据增强方法,并基于细粒度蒸馏思想提出一种结合中心核对齐算法的蒸馏模型。将原始医学数据集利用数据增强方法进行扩充后,输出的文本在蒸馏模型中通过特征向量中心核对齐方式进行特征间高维相似性度量。增强后的医学数据集在两种医学领域基线模型上的皮尔逊系数较未增强前分别提升了2.9%和1.7%。改进后的蒸馏模型在增强后的医学数据集皮尔逊值为81.1%,达到12层教师模型的95%,参数减少了近7倍。 展开更多
关键词 自然语言处理 相似计算 医学文本相似度 数据增强 蒸馏学习 动态蒸馏 中心核对齐
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部