-
题名基于大型语言模型的检索增强生成综述
被引量:8
- 1
-
-
作者
刘雪颖
云静
李博
史晓国
张钰莹
-
机构
内蒙古工业大学数据科学与应用学院
内蒙古自治区大数据软件服务工程技术研究中心
-
出处
《计算机工程与应用》
北大核心
2025年第13期1-25,共25页
-
基金
国家自然科学基金(62062055)
内蒙古高校青年科技英才项目(NJYT24061)
内蒙古自治区直属高校基本科研业务费项目(JY20220249)。
-
文摘
最近,智能体代理能在复杂任务中提供高效的解决方案,在工业界备受关注。作为智能体代理的常见范式之一,检索增强生成(retrieval-augmented generation,RAG)旨在结合信息检索和内容生成技术增强生成响应质量,已逐步成为研究的重点。在对国内外检索增强生成方法研究的基础上,阐述了RAG的基本概念及工作流程,归纳了技术现状,分析了现有RAG技术的优缺点,梳理了现有评估指标、数据集和基准。最后探讨了RAG技术在未来应用场景下所面临的挑战,并展望了其未来发展方向。
-
关键词
大语言模型
检索增强生成
评估基准
-
Keywords
large language models
retrieval-augmented generation
evaluation benchmarks
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于反馈的大语言模型内容与行为对齐方法综述
- 2
-
-
作者
张钰莹
云静
刘雪颖
史晓国
-
机构
内蒙古工业大学数据科学与应用学院
内蒙古自治区大数据软件服务工程技术研究中心
内蒙古北疆网络空间安全重点实验室
-
出处
《计算机工程与应用》
北大核心
2025年第20期75-104,共30页
-
基金
国家自然科学基金(62062055)
内蒙古高校青年科技英才项目(NJYT24061)
内蒙古自治区直属高校基本科研业务费项目(JY20230092)。
-
文摘
近年来,大语言模型在一系列任务中展现了卓越的自然语言理解、生成与推理能力。然而,为了确保其输出符合人类预设标准,对齐成为关键的解决方式。针对“内容对齐”和“行为对齐”两大核心目标,从概念框架、技术实现到评估方法进行了系统综述。明确了获取反馈的来源、格式及其使用目的,建立了基于反馈对齐的概念框架。按照大模型训练、推理和生成的顺序总结了现有的基于反馈对齐的方法。之后回顾了评估大模型的基本技术指标,以及相关的数据集与基准。总结了基于反馈的对齐方法在提升大语言模型性能方面的潜力,以及当前面临的重大挑战和关键问题。
-
关键词
大语言模型(LLMs)
AI对齐
内容安全
评估基准
-
Keywords
large language models(LLMs)
AI alignment
content security
evaluate benchmarks
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-