-
题名对话状态追踪模型的数据增强方法研究
- 1
-
-
作者
刘舒曼
冯洋
-
机构
中国科学院计算技术研究所智能信息处理重点实验室
中国科学院大学
-
出处
《中文信息学报》
北大核心
2025年第4期96-104,共9页
-
文摘
对话状态追踪模型能够支持任务型对话系统识别任务相关的槽位值。然而,由于标注难度大、领域多样化,对话状态追踪模型常面临训练语料稀少和类别难度不均衡等问题。为了解决这些问题,该文提出了使用数据增强的方法。针对类别难度不均衡问题,该文使用局部噪声强化槽位值的多样性,加强模型学习槽位无关对话结构的能力;针对训练语料稀少问题,该文根据语料中由槽位结构构成的任务逻辑序列,通过采样生成逻辑合法的槽位值序列,增强语料逻辑多样性,增加语料数量。该文方法在数据集上经对比和分析实验,能显著缓解对话状态追踪模型中存在的类别难度不均衡和语料稀少问题。
-
关键词
对话状态追踪
数据增强
类别难度不均衡
-
Keywords
dialogue state tracking
data augmentation
imbalance of class difficulty
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-