-
题名对抗性四元组缓解大语言模型自相矛盾型幻觉研究
- 1
-
-
作者
冯巍山
金澎
陈兴元
王兵
郭宽
-
机构
西南石油大学计算机与软件学院
乐山师范学院互联网自然语言智能处理四川省高校重点实验室
乐山师范学院特殊教育语言智能处理四川省哲学社会科学重点实验室
-
出处
《中文信息学报》
北大核心
2025年第8期1-10,共10页
-
基金
教育部人文社科项目(23YJA740013)
四川省自然科学基金(24NSFSC0520)。
-
文摘
为了缓解大语言模型输出中的幻觉现象——即生成的文本看似合理,实则包含错误或误导性内容,该文设计开发了一个消除自相矛盾型幻觉的自动化处理框架QCDetector。该框架利用四元组架构进行原子级知识事实的精准提取与表征,并通过注入对抗性四元组,诱导模型触发自我矛盾的幻觉状态,从而揭示其生成文本的非事实性。进一步地,通过消除矛盾信息,以实现幻觉的缓解。在英文数据集MainTestSet上的实验结果表明,QCDetector能够在低成本环境下高效检测并缓解幻觉。为了进一步验证QCDetector的有效性,该文构建了一个中文幻觉数据集ChineseTopicHullSet,F1值达到了39.5%。值得一提的是,QCDetector完全基于提示完成,使得其可以适用于任何语言模型。
-
关键词
大语言模型
自相矛盾
幻觉检测
幻觉缓解
-
Keywords
large language models
self-contradictory
hallucination detection
hallucination mitigation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-