-
题名基于自适应学习的大模型RAG增强方法
- 1
-
-
作者
孙亚茹
林九川
付文豪
宋铮
杨莹
卢涛
-
机构
公安部第三研究所网络侦查技术研发中心
-
出处
《计算机工程与设计》
北大核心
2025年第7期2004-2011,共8页
-
基金
国家重点研发计划基金项目(2021YFB3101404-2)
公安部第三研究所优青基金项目(KZC23261)
公安部第三研究所重点基科费基金项目(KYC24323)。
-
文摘
针对大模型在检索增强生成中存在的无效检索、结果不相关及信息利用率低等问题,提出一种自适应学习驱动的优化策略。该策略包含自适应检索增强和生成增强组件。前者通过建模领域问题特征,提升对检索意图的理解,结合知识图谱提高检索实体的覆盖性和关联性,增强检索精度;后者利用信息压缩与重排序技术,减少冗余信息,增强相关检索数据对生成过程的影响,确保生成内容的质量。实验结果表明,该策略在短文本生成、长文本生成、多选问答和大规模数据检索等任务中取得了较优结果,有效验证了其在高效利用外部数据资源方面的优越性。
-
关键词
大型语言模型
检索增强生成
自适应学习
意图识别
知识图谱
信息压缩
特征建模
-
Keywords
large language models
retrieval augmented generation
adaptive-learning
intent recognition
knowledge graph
information compression
feature modeling
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-