涵盖DRG编码的真实电子病历数据过少无法支撑语言模型学习文本特征,并且现有的疾病编码模型针对复杂文本难以作出结果解释。为此,设计了一种融合医疗知识图谱和大语言模型的医疗问答系统模型GLM-2B-DRAGON。首先,利用Chat GLM-6b模型抽...涵盖DRG编码的真实电子病历数据过少无法支撑语言模型学习文本特征,并且现有的疾病编码模型针对复杂文本难以作出结果解释。为此,设计了一种融合医疗知识图谱和大语言模型的医疗问答系统模型GLM-2B-DRAGON。首先,利用Chat GLM-6b模型抽取并更新医疗实体及实体关系,得到涵盖DRG编码等医疗知识的知识图谱DRG-Net;其次,使用跨模态编码器将QA问题对与知识图谱进行联合编码,实现相互补充的文本-图谱双向信息流以捕捉医疗文本特征;最后,通过知识图谱路径权重可视化分析,验证回答结果的可解释性。实验结果表明:在公开数据集Commen Sens e QA和自建医疗数据集Medical QA上,所构建的医疗问答系统模型优于现有的知识图谱增强语言模型。展开更多
文摘涵盖DRG编码的真实电子病历数据过少无法支撑语言模型学习文本特征,并且现有的疾病编码模型针对复杂文本难以作出结果解释。为此,设计了一种融合医疗知识图谱和大语言模型的医疗问答系统模型GLM-2B-DRAGON。首先,利用Chat GLM-6b模型抽取并更新医疗实体及实体关系,得到涵盖DRG编码等医疗知识的知识图谱DRG-Net;其次,使用跨模态编码器将QA问题对与知识图谱进行联合编码,实现相互补充的文本-图谱双向信息流以捕捉医疗文本特征;最后,通过知识图谱路径权重可视化分析,验证回答结果的可解释性。实验结果表明:在公开数据集Commen Sens e QA和自建医疗数据集Medical QA上,所构建的医疗问答系统模型优于现有的知识图谱增强语言模型。