期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于提示学习的生成式医疗对话理解方法
1
作者 柳俊 阮彤 张欢欢 《计算机科学》 CSCD 北大核心 2024年第5期258-266,共9页
任务型对话系统中的对话理解模块的目标是将用户输入的自然语言转换成结构化的形式,但在面向诊断的医疗对话系统中,现有方法存在如下问题:1)无法支持精准医疗所需的信息粒度,如给出某一症状的严重程度;2)难以同时满足医疗领域中多样化... 任务型对话系统中的对话理解模块的目标是将用户输入的自然语言转换成结构化的形式,但在面向诊断的医疗对话系统中,现有方法存在如下问题:1)无法支持精准医疗所需的信息粒度,如给出某一症状的严重程度;2)难以同时满足医疗领域中多样化的槽值表示形式,如“症状”等可能含有非连续与嵌套实体的抽取型槽以及“否定”等分类型槽。文中提出了一种基于提示学习的多层次生成式医疗对话理解方法。针对问题1),用多层次槽结构替代当前对话理解任务中单层的槽结构,以表示更细粒度的信息,之后采用一种基于对话风格提示的生成式方法,利用提示字符模拟医患对话,从多轮交互中获得多层次信息。针对问题2),提出在推理过程中使用一种受限的解码策略,使模型能够以统一的方式处理意图识别与分类型和抽取型的槽填充任务,避免复杂的建模。此外,针对医疗领域缺少标注数据的问题,提出了一种两阶段训练策略,以充分利用大规模的无标注医疗对话语料来提升性能。针对含有多层次槽结构的医疗对话理解任务标注并发布了一个数据集,包含4722条对话,涉及17种意图与74种槽。实验结果表明,所提方法能够有效解析医疗对话中的各种复杂实体,相比已有的生成方法,其性能高出2.18%,而在小样本的场景下两阶段训练最高能提高模型5.23%的性能。 展开更多
关键词 提示学习 自然语言理解 医疗对话系统 生成式模型 两阶段训练
在线阅读 下载PDF
基于双向自举蒸馏的异质云-端医疗对话联邦
2
作者 刘宇鹏 林明豪 +1 位作者 张江 姚登举 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第10期2062-2068,共7页
医疗对话场景下的数据/模型异质、数据类型不同,为此提出新的联邦学习方法.云模型和端模型以相互自举蒸馏的方式进行知识递进传递.端到云的自举蒸馏过程为多教师-单学生模式,知识被从多个局部模型蒸馏统一到全局模型;云到端的自举蒸馏... 医疗对话场景下的数据/模型异质、数据类型不同,为此提出新的联邦学习方法.云模型和端模型以相互自举蒸馏的方式进行知识递进传递.端到云的自举蒸馏过程为多教师-单学生模式,知识被从多个局部模型蒸馏统一到全局模型;云到端的自举蒸馏过程为单教师-多学生模式,知识被从全局模型蒸馏回多个局部模型.在医疗对话ReMeDi和MedDG数据集上,所提方法与经典基线相比通过文本生成指标评价获得了显著提高,训练速度有所提升. 展开更多
关键词 自举蒸馏 异质数据 异质模型 结构正则 医疗对话
在线阅读 下载PDF
基于记忆网络的知识感知医疗对话生成 被引量:1
3
作者 张晓宇 李冬冬 +3 位作者 任鹏杰 陈竹敏 马军 任昭春 《计算机研究与发展》 EI CSCD 北大核心 2022年第12期2889-2900,共12页
为了解决就医过程中医疗资源短缺和患者时间不充裕、行程不便的问题,提出了结合外部知识的基于记忆网络的知识感知医疗对话生成模型(memory networks based knowledge-aware medical dialogue generation model,MKMed).该模型首先通过... 为了解决就医过程中医疗资源短缺和患者时间不充裕、行程不便的问题,提出了结合外部知识的基于记忆网络的知识感知医疗对话生成模型(memory networks based knowledge-aware medical dialogue generation model,MKMed).该模型首先通过利用精确字匹配的方法在对话历史中进行实体追踪;随后在外部实体知识数据库里设计2阶段的实体预测,筛选出可能出现在回复中的医疗实体及对应知识,其中2阶段实体预测分别利用计算共现矩阵和余弦相似度的方法;模型接着用记忆网络来存储知识和对话历史的信息;最后整合记忆网络存储的信息,并使用注意力机制以及循环神经网络生成回复.在带有外部知识的大规模医疗对话数据集KaMed上进行了相关实验,该数据集为收集自在线平台的真实数据.实验结果表明提出的模型生成的回复在流畅性、多样性、正确性和专业性等方面均显著优于大部分基准模型.证明了合理引入外部知识的医疗对话模型能产生成更有医疗价值的回复. 展开更多
关键词 医疗对话 知识感知 记忆网络 循环神经网络 注意力机制
在线阅读 下载PDF
基于Prompt策略的医疗对话生成 被引量:4
4
作者 杨锦锋 梁先桂 +1 位作者 王刘安 蔡巍 《中文信息学报》 CSCD 北大核心 2023年第4期118-125,共8页
构建医疗对话系统可以缓和医疗资源紧缺和医疗资源分配不均的现状,在对话系统构建方面,如何结合已获取的知识生成对话语句是重要研究内容之一。Prompt指预先输入到语言模型的一组字符序列或编码,后续的推断从这里开始,从而影响整个语句... 构建医疗对话系统可以缓和医疗资源紧缺和医疗资源分配不均的现状,在对话系统构建方面,如何结合已获取的知识生成对话语句是重要研究内容之一。Prompt指预先输入到语言模型的一组字符序列或编码,后续的推断从这里开始,从而影响整个语句的内容生成。该文先用医疗领域语料来对预训练语言模型进行精调,以学习医疗语句潜在的语义,然后设计Prompt方案将医疗实体引入对话生成模型,使生成的对话能够携带预设的知识,达到受控对话生成的目的。通过在医疗对话数据集MedDG上的实验验证,该文提出的方案能有效改善医疗对话生成的效果。 展开更多
关键词 医疗对话生成 受控文本生成 对话系统
在线阅读 下载PDF
基于对比学习的儿科问诊对话细粒度意图识别
5
作者 李文博 董青 +1 位作者 刘超 张奇 《广西师范大学学报(自然科学版)》 CAS 北大核心 2024年第4期1-10,共10页
问诊对话系统的基础是自然语言理解。自然语言理解是指从对话信息中提取出意图信息和实体信息,并将其转换为结构化表达,主要包括意图识别和槽填充2种任务。意图识别是一种典型的文本分类任务,槽填充则是使用序列算法从对话文本中根据预... 问诊对话系统的基础是自然语言理解。自然语言理解是指从对话信息中提取出意图信息和实体信息,并将其转换为结构化表达,主要包括意图识别和槽填充2种任务。意图识别是一种典型的文本分类任务,槽填充则是使用序列算法从对话文本中根据预先设定好的槽位抽取对应的槽位值。传统的方法通常对意图识别和槽填充2个任务分别构建模型,并在意图识别的基础上根据意图进行槽填充,但是这种方式容易造成错误传播。针对该问题,本文提出一种基于对比学习方法的融合对话意图分类和语义槽取值的细粒度意图识别方法。该方法结合意图分类和语义槽取值任务,使用BART作为骨干模型进行改进和创新,该模型使用编解码架构,意图识别和槽填充任务共享一个编码层,解码层采用字级别标签,通过将意图信息融合进槽填充任务,并在样本构造过程中引入对比学习。实验结果表明,本文算法在医患对话数据集上的意图识别准确率达到81.96%,槽填充的F_1分数达到85.26%,与其他算法相比有明显的效果提升。另外,通过消融实验和样例分析,进一步证明了本文算法的效果。 展开更多
关键词 对比学习 意图识别 槽填充 细粒度 医疗对话
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部