近年来,利用文本、视觉和音频数据分析视频中说话者情感的多模态情感分析(MSA)引起了广泛关注。然而,不同模态在情感分析中的贡献大不相同。通常,文本中包含的信息更加直观,因此寻求一种用于增强文本在情感分析中作用的策略显得尤为重...近年来,利用文本、视觉和音频数据分析视频中说话者情感的多模态情感分析(MSA)引起了广泛关注。然而,不同模态在情感分析中的贡献大不相同。通常,文本中包含的信息更加直观,因此寻求一种用于增强文本在情感分析中作用的策略显得尤为重要。针对这一问题,提出一种跨模态文本信息增强的多模态情感分析模型(MSAMCTE)。首先,使用BERT(Bidirectional Encoder Representations from Transformers)预训练模型提取文本特征,并使用双向长短期记忆(Bi-LSTM)网络对预处理后的音频和视频特征进行进一步处理;其次,通过基于文本的交叉注意力机制,将文本信息融入情感相关的非语言表示中,以学习面向文本的成对跨模态映射,从而获得有效的统一多模态表示;最后,使用融合特征进行情感分析。实验结果表明,与最优的基线模型——文本增强Transformer融合网络(TETFN)相比,MSAM-CTE在数据集CMU-MOSI(Carnegie Mellon University Multimodal Opinion Sentiment Intensity)上的平均绝对误差(MAE)和皮尔逊相关系数(Corr)分别降低了2.6%和提高了0.1%;在数据集CMU-MOSEI(Carnegie Mellon University Multimodal Opinion Sentiment and Emotion Intensity)上的两个指标分别降低了3.8%和提高了1.7%,验证了MSAM-CTE在情感分析中的有效性。展开更多
涵盖DRG编码的真实电子病历数据过少无法支撑语言模型学习文本特征,并且现有的疾病编码模型针对复杂文本难以作出结果解释。为此,设计了一种融合医疗知识图谱和大语言模型的医疗问答系统模型GLM-2B-DRAGON。首先,利用Chat GLM-6b模型抽...涵盖DRG编码的真实电子病历数据过少无法支撑语言模型学习文本特征,并且现有的疾病编码模型针对复杂文本难以作出结果解释。为此,设计了一种融合医疗知识图谱和大语言模型的医疗问答系统模型GLM-2B-DRAGON。首先,利用Chat GLM-6b模型抽取并更新医疗实体及实体关系,得到涵盖DRG编码等医疗知识的知识图谱DRG-Net;其次,使用跨模态编码器将QA问题对与知识图谱进行联合编码,实现相互补充的文本-图谱双向信息流以捕捉医疗文本特征;最后,通过知识图谱路径权重可视化分析,验证回答结果的可解释性。实验结果表明:在公开数据集Commen Sens e QA和自建医疗数据集Medical QA上,所构建的医疗问答系统模型优于现有的知识图谱增强语言模型。展开更多
文摘近年来,利用文本、视觉和音频数据分析视频中说话者情感的多模态情感分析(MSA)引起了广泛关注。然而,不同模态在情感分析中的贡献大不相同。通常,文本中包含的信息更加直观,因此寻求一种用于增强文本在情感分析中作用的策略显得尤为重要。针对这一问题,提出一种跨模态文本信息增强的多模态情感分析模型(MSAMCTE)。首先,使用BERT(Bidirectional Encoder Representations from Transformers)预训练模型提取文本特征,并使用双向长短期记忆(Bi-LSTM)网络对预处理后的音频和视频特征进行进一步处理;其次,通过基于文本的交叉注意力机制,将文本信息融入情感相关的非语言表示中,以学习面向文本的成对跨模态映射,从而获得有效的统一多模态表示;最后,使用融合特征进行情感分析。实验结果表明,与最优的基线模型——文本增强Transformer融合网络(TETFN)相比,MSAM-CTE在数据集CMU-MOSI(Carnegie Mellon University Multimodal Opinion Sentiment Intensity)上的平均绝对误差(MAE)和皮尔逊相关系数(Corr)分别降低了2.6%和提高了0.1%;在数据集CMU-MOSEI(Carnegie Mellon University Multimodal Opinion Sentiment and Emotion Intensity)上的两个指标分别降低了3.8%和提高了1.7%,验证了MSAM-CTE在情感分析中的有效性。
文摘涵盖DRG编码的真实电子病历数据过少无法支撑语言模型学习文本特征,并且现有的疾病编码模型针对复杂文本难以作出结果解释。为此,设计了一种融合医疗知识图谱和大语言模型的医疗问答系统模型GLM-2B-DRAGON。首先,利用Chat GLM-6b模型抽取并更新医疗实体及实体关系,得到涵盖DRG编码等医疗知识的知识图谱DRG-Net;其次,使用跨模态编码器将QA问题对与知识图谱进行联合编码,实现相互补充的文本-图谱双向信息流以捕捉医疗文本特征;最后,通过知识图谱路径权重可视化分析,验证回答结果的可解释性。实验结果表明:在公开数据集Commen Sens e QA和自建医疗数据集Medical QA上,所构建的医疗问答系统模型优于现有的知识图谱增强语言模型。