期刊文献+
共找到1,257篇文章
< 1 2 63 >
每页显示 20 50 100
大语言模型综述与展望 被引量:9
1
作者 秦小林 古徐 +1 位作者 李弟诚 徐海文 《计算机应用》 北大核心 2025年第3期685-696,共12页
大语言模型(LLM)是由具有大量参数(通常数十亿个权重或更多)的人工神经网络组成的一类语言模型,使用自监督学习或半监督学习对大量未标记文本进行训练,是当前生成式人工智能(AI)技术的核心。与传统语言模型相比,LLM通过大量的算力、参... 大语言模型(LLM)是由具有大量参数(通常数十亿个权重或更多)的人工神经网络组成的一类语言模型,使用自监督学习或半监督学习对大量未标记文本进行训练,是当前生成式人工智能(AI)技术的核心。与传统语言模型相比,LLM通过大量的算力、参数和数据支持,展现出更强的语言理解与生成能力,广泛应用于机器翻译、问答系统、对话生成等众多任务中并表现卓越。现有的综述大多侧重于LLM的理论架构与训练方法,对LLM的产业级应用实践及技术生态演进的系统性探讨仍显不足。因此,在介绍LLM的基础架构、训练技术及发展历程的基础上,分析当前通用的LLM关键技术和以LLM为底座的先进融合技术。通过归纳总结现有研究,进一步阐述LLM在实际应用中面临的挑战,包括数据偏差、模型幻觉和计算资源消耗等问题,并对LLM的持续发展趋势进行展望。 展开更多
关键词 大语言模型 智能体 自然语言处理 检索增强生成 模型幻觉
在线阅读 下载PDF
基于大型语言模型的AI招生咨询助理设计与实现 被引量:2
2
作者 阮昆 杨璟轩 +3 位作者 殷旭 储雯 罗婷婷 黄容 《实验室研究与探索》 北大核心 2025年第2期110-116,共7页
针对高考招生咨询业务繁忙,咨询覆盖范围有限、咨询效率不高等问题,基于检索增强生成、大型语言模型、提示词工程和检索增强生成转结构化查询语言等技术构建AI招生咨询助理,搜集学校招生信息网招生政策、常见问题、学院专业介绍等建立... 针对高考招生咨询业务繁忙,咨询覆盖范围有限、咨询效率不高等问题,基于检索增强生成、大型语言模型、提示词工程和检索增强生成转结构化查询语言等技术构建AI招生咨询助理,搜集学校招生信息网招生政策、常见问题、学院专业介绍等建立本地权威招生知识库,对政策咨询类问题直接在本地向量知识库检索,对数据查询类问题转化为SQL数据查询,将检索或查询结果送至大模型推理生成回复,提升提问方式的自由度以及问题回复的权威性和实时性,降低大模型幻觉,实现全天候为考生和家长提供精准化、智能化、个性化的咨询服务。在2024年高考招生咨询中,大幅度减轻学校招生咨询工作压力,有效提升招生咨询效率,促进公平获取招生信息。 展开更多
关键词 大型语言模型 检索增强生成技术 提示词工程 招生咨询
在线阅读 下载PDF
基于大模型检索增强生成的气象数据库问答模型实现 被引量:2
3
作者 江双五 张嘉玮 +1 位作者 华连生 杨菁林 《计算机工程与应用》 北大核心 2025年第5期113-121,共9页
随着信息检索和知识获取需求的增加,智能问答系统在多个垂直领域得到广泛应用。然而,在气象领域仍缺乏专门的智能问答系统研究,严重限制了气象信息的高效利用和气象系统的服务效率。针对这一需求,提出了一种面向气象数据库的大模型检索... 随着信息检索和知识获取需求的增加,智能问答系统在多个垂直领域得到广泛应用。然而,在气象领域仍缺乏专门的智能问答系统研究,严重限制了气象信息的高效利用和气象系统的服务效率。针对这一需求,提出了一种面向气象数据库的大模型检索智能问答技术实现方案。该方案设计了一种基于关系型数据库(SQL)与文档型数据(NoSQL)的多通道查询路由(multi-channel retrieval router,McRR)方法,为了适配数据库进行大模型查询以及增强大模型对查询表的理解,分别提出指令查询转换方法与数据库表摘要方法DNSUM,提升大模型对数据库的语义理解能力,通过结合问题理解、重排序器和响应生成等关键模块,构建了一个端到端的智能问答模型,可实现多数据源的相关知识检索及答案生成。实验结果显示,该模型可以有效理解用户问题并生成准确的答案,具有良好的检索和响应能力。不仅为气象领域提供了一种智能问答的解决方案,也为气象智能问答技术提供了新的应用实施参考。 展开更多
关键词 数据库查询 数据库问答 大语言模型 检索增强生成 气象问答
在线阅读 下载PDF
基于信息检索的知识库问答综述 被引量:5
4
作者 田萱 吴志超 《计算机研究与发展》 北大核心 2025年第2期314-335,共22页
知识库问答旨在从知识库中检索相关信息用于模型推理,最终返回准确的答案.近年来随着深度学习和大语言模型的发展,基于信息检索的知识库问答研究成为焦点,涌现出许多新颖方法.从模型方法、数据集等不同方面对基于信息检索的知识库问答... 知识库问答旨在从知识库中检索相关信息用于模型推理,最终返回准确的答案.近年来随着深度学习和大语言模型的发展,基于信息检索的知识库问答研究成为焦点,涌现出许多新颖方法.从模型方法、数据集等不同方面对基于信息检索的知识库问答研究进行梳理总结.首先对知识库问答的研究意义和相关定义进行介绍.然后按照模型执行过程从问句解析、信息检索、模型推理、答案生成这4个阶段阐述每个阶段面临的关键问题以及典型解决方法,对每个阶段所使用到的共性网络模块进行总结.其次针对基于信息检索的知识库问答方法的不可解释性进行分析梳理.此外,对不同特点的相关数据集和不同阶段的基线模型进行了分类介绍与总结.最后对基于信息检索的知识库问答每个执行阶段以及该领域整体发展方向进行了总结和展望. 展开更多
关键词 知识库问答 信息检索 深度学习 大语言模型 阶段性问题
在线阅读 下载PDF
大语言模型及其在矿物问答系统中的应用
5
作者 季晓慧 刘成健 +4 位作者 杨眉 何明跃 张招崇 曾姗 王玉柱 《矿物岩石地球化学通报》 北大核心 2025年第3期453-461,I0002,共10页
大语言模型(LLMs,Large Language Models)具有极强的自然语言理解和复杂问题求解能力,本文基于大语言模型构建了矿物问答系统,以高效地获取矿物知识。该系统首先从互联网资源获取矿物数据,清洗后将矿物数据结构化为矿物文档和问答对;将... 大语言模型(LLMs,Large Language Models)具有极强的自然语言理解和复杂问题求解能力,本文基于大语言模型构建了矿物问答系统,以高效地获取矿物知识。该系统首先从互联网资源获取矿物数据,清洗后将矿物数据结构化为矿物文档和问答对;将矿物文档经过格式转换和建立索引后转化为矿物知识库,用于检索增强大语言模型生成,问答对用于微调大语言模型。使用矿物知识库检索增强大语言模型生成时,采用先召回再精排的两级检索模式,以获得更好的大语言模型生成结果。矿物大语言模型微调采用了主流的低秩适配(Low-Rank Adaption,LoRA)方法,以较少的训练参数获得了与全参微调性能相当的效果,节省了计算资源。实验结果表明,基于检索增强生成的大语言模型的矿物问答系统能以较高的准确率快捷地获取矿物知识。 展开更多
关键词 大语言模型 矿物 检索增强生成 低秩适配 问答系统
在线阅读 下载PDF
基于大语言模型的企业碳排放分析与知识问答系统
6
作者 韩明 曹智轩 +2 位作者 王敬涛 段丽英 王剑宏 《计算机工程与应用》 北大核心 2025年第16期370-382,共13页
随着全球气候变化日益严重,企业碳排放分析成为国际关注的焦点,针对通用大语言模型(large language model,LLM)知识更新滞后,增强生成架构在处理复杂问题时缺乏专业性与准确性,以及大模型生成结果中幻觉率高的问题,通过构建专有知识库,... 随着全球气候变化日益严重,企业碳排放分析成为国际关注的焦点,针对通用大语言模型(large language model,LLM)知识更新滞后,增强生成架构在处理复杂问题时缺乏专业性与准确性,以及大模型生成结果中幻觉率高的问题,通过构建专有知识库,开发了基于大语言模型的企业碳排放分析与知识问答系统。提出了一种多样化索引模块构建方法,构建高质量的知识与法规检索数据集。针对碳排放报告(政策)领域的知识问答任务,提出了自提示检索增强生成架构,集成意图识别、改进的结构化思维链、混合检索技术、高质量提示工程和Text2SQL系统,支持多维度分析企业可持续性报告,为企业碳排放报告(政策)提供了一种高效、精准的知识问答解决方案。通过多层分块机制、文档索引和幻觉识别功能,确保结果的准确性与可验证性,降低了LLM技术在系统中的幻觉率。通过对比实验,所提算法在各模块的协同下在检索增强生成实验中各指标表现优异,对于企业碳排放报告的关键信息抽取和报告评价,尤其是长文本处理具有明显的优势。 展开更多
关键词 大语言模型(LLM) 知识问答系统 大模型幻觉 信息检索 提示学习
在线阅读 下载PDF
架空机器人紧凑型仓储系统单轨道取货调度研究
7
作者 马云峰 陈磊 +2 位作者 胡依娜 任亮 周志刚 《运筹与管理》 北大核心 2025年第5期97-103,共7页
架空机器人紧凑型仓储系统是一种密集型仓储系统,该系统在拥有超高存储密度的同时还保证了较高的存取速度。为解决架空机器人紧凑型仓储系统中的单轨道取货这一基本问题,以最小化翻箱次数和拣选机器人负载移动距离为目标,建立了整数规... 架空机器人紧凑型仓储系统是一种密集型仓储系统,该系统在拥有超高存储密度的同时还保证了较高的存取速度。为解决架空机器人紧凑型仓储系统中的单轨道取货这一基本问题,以最小化翻箱次数和拣选机器人负载移动距离为目标,建立了整数规划模型,并设计了基于集束搜索的启发式算法(BSH)。数值实验表明,对于小规模算例,整数规划模型可以在合理时间得到最优解,启发式算法也可以在短时间得出近似最优解并且与整数规划模型的gap维持在1%左右;对于中到大规模算例,整数规划模型无法在合理的时间得出最优解,BSH算法可以在短时间得出优质解,与企业常用的贪心算法对比均能降低20%以上的取货成本;与传统的集束搜索算法相比,BSH算法的性能提升了7%到12%,证明了BSH算法改进的有效性;在系统配置方面,得出了随着轨道中货位数量增加,最优堆栈层数也在增加的结论,为企业的实际应用提供决策支持。 展开更多
关键词 调度 紧致化仓储系统 ORCSRS 整数规划模型 启发式算法
在线阅读 下载PDF
基于大模型的服装推荐智能问答系统构建
8
作者 游小荣 李淑芳 邵红燕 《毛纺科技》 北大核心 2025年第5期87-94,共8页
为了满足用户对个性化服装推荐的需求,构建了一种基于大模型技术的服装推荐智能问答系统。首先,为提升大模型在服装推荐领域的推理能力,基于fashion-style-instruct数据集对Llama27B、Orca27B和Mistral 7B大模型进行有监督微调,生成针... 为了满足用户对个性化服装推荐的需求,构建了一种基于大模型技术的服装推荐智能问答系统。首先,为提升大模型在服装推荐领域的推理能力,基于fashion-style-instruct数据集对Llama27B、Orca27B和Mistral 7B大模型进行有监督微调,生成针对服装推荐任务的优化模型;其次,对H&M个性化时尚推荐数据集中的部分数据进行向量化处理,并引入检索增强生成技术,以提升模型的准确性与透明度;最后,基于微调和检索增强生成技术设计了一套服装推荐智能问答系统。实验结果表明,相较于未进行微调与检索增强生成技术优化的基准系统,本文所构建的系统在余弦相似度、BLEU及人工评估指标上分别提升了59.74%、103.64%、22.22%;在具体问答案例分析中,本文构建系统在个性化服装推荐智能问答的细节表现上也优于ChatGPT 3.5。本文所构建的系统在服装推荐大模型应用领域具有较高的应用价值和推广潜力。 展开更多
关键词 服装推荐 大模型 个性化 问答系统 检索增强生成
在线阅读 下载PDF
基于大语言模型的重大慢病健康管理信息系统构建
9
作者 吴天星 曹旭东 +5 位作者 毕胜 陈亚 蔡平强 沙航宇 漆桂林 王昊奋 《计算机研究与发展》 北大核心 2025年第7期1653-1667,共15页
随着全球人口老龄化和生活方式的变化,慢性病(慢病)的管理和治疗变得日益重要.慢病包括心血管疾病、糖尿病、慢性呼吸系统疾病等,它们通常需要长期甚至终身的健康管理,其核心在于制定和执行长期的健康计划,包括合理饮食、适量运动、定... 随着全球人口老龄化和生活方式的变化,慢性病(慢病)的管理和治疗变得日益重要.慢病包括心血管疾病、糖尿病、慢性呼吸系统疾病等,它们通常需要长期甚至终身的健康管理,其核心在于制定和执行长期的健康计划,包括合理饮食、适量运动、定期检查和用药管理等.近年来,大语言模型在医疗领域取得了一定的进展,但并未关注慢病健康管理领域,因此在个性化健康管理建议方面缺乏对中国特定饮食习惯和文化背景的深入理解,在处理数字信息方面的能力有限.为解决这些问题,构建了基于大语言模型的重大慢病健康管理信息系统.其中,通过整合慢病基础知识、健康管理指导原则以及实际的健康管理计划作为领域数据,训练蜻蜓大模型作为系统的核心,用于健康相关问题的有效回答.此外,系统引入了工具增强策略,通过调用工具增强蜻蜓大模型对健康数据中数字信息的处理能力.同时,系统采用了基于不确定性知识图谱的检索增强生成技术,进一步提升蜻蜓大模型在答复慢病管理相关问题时的精确性和可信度.对基于大语言模型的重大慢病健康管理信息系统的测试实验显示,蜻蜓大模型在健康管理对话中的表现明显优于其他大语言模型,并验证了工具增强与检索增强方法的有效性. 展开更多
关键词 信息系统 大语言模型 健康管理 慢病 检索增强生成 蜻蜓
在线阅读 下载PDF
基于多主体仿真模型与LLMs的林火航空应急救援任务分配决策
10
作者 沈洋 陈襄 +1 位作者 汪娴冰 韩佳琪 《指挥与控制学报》 北大核心 2025年第2期225-238,共14页
在林火应急救援操作中,有效的航空资源调度对于提高救援效率至关重要。提出一种创新方法,将大语言模型与多主体仿真模型相结合,以增强应急决策能力。构建一个全面且可扩展的多主体仿真框架,能够模拟多种火灾情景和救援行动,为决策的智... 在林火应急救援操作中,有效的航空资源调度对于提高救援效率至关重要。提出一种创新方法,将大语言模型与多主体仿真模型相结合,以增强应急决策能力。构建一个全面且可扩展的多主体仿真框架,能够模拟多种火灾情景和救援行动,为决策的智能化验证和迭代提供了实验基础。将大语言模型集成到仿真模型中,通过自然语言处理技术实现了任务分配方案的进一步优化。为提高大语言模型辅助决策的质量和稳定性,还引入检索增强生成技术框架。相关仿真实验结果表明,大语言模型在应急救援决策中可发挥出关键性的辅助作用,显著提升决策效率和准确性。 展开更多
关键词 航空应急救援 多主体仿真 大语言模型 决策智能 林火蔓延 检索增强生成
在线阅读 下载PDF
基于混合检索增强生成大语言模型的网络舆情多任务分析 被引量:3
11
作者 王润周 张新生 +2 位作者 王明虎 苏佳 马玉龙 《情报杂志》 北大核心 2025年第5期91-103,共13页
[研究目的]为缓解大语言模型在网络舆情分析过程中出现输出与现实不符或不正确的“幻觉”现象,以及大语言模型的微调过程通常需要耗费大量的机器资源的问题,提出一种混合检索增强生成策略(Retrieval-Augmented Generation,RAG)来提升大... [研究目的]为缓解大语言模型在网络舆情分析过程中出现输出与现实不符或不正确的“幻觉”现象,以及大语言模型的微调过程通常需要耗费大量的机器资源的问题,提出一种混合检索增强生成策略(Retrieval-Augmented Generation,RAG)来提升大语言模型的自然语言理解和生成能力,实现网络舆情的跨领域、跨任务分析。[研究方法]首先,整合高质量舆情事件数据集构建本地RAG知识库以适应不同领域,避免大规模参数微调,在生成过程中引入检索知识减缓“幻觉”现象。并且,引入上下文信息与提示样例进行知识增强,提升大语言模型在下游任务的准确性。最终整合检索内容、上下文信息、提示样例构建针对舆情分析任务的提示语句,将源领域知识迁移到目标领域。[研究结果/结论]实验结果表明,所构建的混合RAG框架在虚假信息检测、自动化报告生成、智能问答、信息抽取、情感分析多种跨领域、跨语言数据集中表现优异,且能够适应少样本学习的场景。 展开更多
关键词 网络舆情 舆情分析 大语言模型 检索增强生成(RAG) 提示学习
在线阅读 下载PDF
一种基于知识图谱的检索增强生成情报问答技术 被引量:4
12
作者 成志宇 陈星霖 +2 位作者 王菁 周中元 张志政 《计算机科学》 北大核心 2025年第1期87-93,共7页
为实现军事情报问答,提出了一种基于知识图谱的检索增强生成框架。该框架通过问题分类、实体识别、实体链接、知识检索有效地获取了背景知识。同时考虑到情报问题多约束的特点,使用回答集编程在知识上通过约束限制减少知识数量或者直接... 为实现军事情报问答,提出了一种基于知识图谱的检索增强生成框架。该框架通过问题分类、实体识别、实体链接、知识检索有效地获取了背景知识。同时考虑到情报问题多约束的特点,使用回答集编程在知识上通过约束限制减少知识数量或者直接获得答案。最后,使用大语言模型在精炼后的知识上对问题进行求解,以减少问题理解过程中的属性识别与链接。在MilRE数据集上的实验表明,所提框架能够提供基于知识图谱的增强知识检索功能,并具有较好的军事情报问题解答能力。 展开更多
关键词 情报问答 回答集编程 大语言模型 检索增强生成 知识图谱
在线阅读 下载PDF
基于大语言模型的智能问答系统研究综述 被引量:14
13
作者 任海玉 刘建平 +4 位作者 王健 顾勋勋 陈曦 张越 赵昌顼 《计算机工程与应用》 北大核心 2025年第7期1-24,共24页
智能问答是自然语言处理中的一个核心的子领域,旨在理解并回答用户提出的自然语言问题的系统。传统的问答系统通常依赖于预定义的规则和有限的语料库,无法处理复杂的多轮对话。大语言模型是一种基于深度学习技术的自然语言处理模型,拥... 智能问答是自然语言处理中的一个核心的子领域,旨在理解并回答用户提出的自然语言问题的系统。传统的问答系统通常依赖于预定义的规则和有限的语料库,无法处理复杂的多轮对话。大语言模型是一种基于深度学习技术的自然语言处理模型,拥有数十亿甚至上千亿个参数,不仅能够理解和生成自然语言,还能显著提升问答系统的准确性和效率,推动智能问答技术的发展。近年来,基于大模型技术的智能问答逐渐成为研究热点,但对该领域的系统性综述仍然较为欠缺。因此,针对大模型的智能问答系统进行系统综述,介绍了问答系统的基本概念和数据集及其评价指标;介绍了基于大模型的问答系统,其中包括基于提示学习的问答系统、基于知识图谱的问答系统、基于检索增强生成的问答系统和基于智能代理的问答系统以及微调在问答任务中的技术路线,并对比了五种方法在问答系统中的优缺点和应用场景;对于当前基于大语言模型的问答系统面临的研究挑战和未来发展趋势进行了总结。 展开更多
关键词 大语言模型 智能问答 自然语言处理 检索增强生成 提示学习 知识图谱
在线阅读 下载PDF
人工智能大模型在电力设备运维场景中的应用探讨 被引量:3
14
作者 陈晓红 傅文润 +4 位作者 刘朝明 刘泽洪 李俊朋 胡志亮 胡东滨 《中国工程科学》 北大核心 2025年第1期180-192,共13页
电力设备运维是新型电力系统建设的重要环节,以人工智能(AI)大模型技术为代表的AI技术变革为传统电力设备运维的数智化提供了新机遇。本文探讨了多模态AI大模型对电力设备健康状态评估、电力设备运行状态预测、电力设备故障诊断、电力... 电力设备运维是新型电力系统建设的重要环节,以人工智能(AI)大模型技术为代表的AI技术变革为传统电力设备运维的数智化提供了新机遇。本文探讨了多模态AI大模型对电力设备健康状态评估、电力设备运行状态预测、电力设备故障诊断、电力设备寿命预测、电力设备故障检修策略推荐等电力运维具体场景的赋能作用,辨识了数据问题制约电力AI大模型的应用成效、“算法黑箱”影响智能运维辅助决策的透明度与可靠性、环境变化导致电力AI大模型性能衰退等多模态AI大模型赋能电力设备运维的技术难点。着眼攻克相关技术难点,结合知识图谱检索增强生成、多模态对齐、微调和持续学习等大模型应用优化技术,构建了基于多模态AI大模型的电力设备运维系统架构,梳理了多模态AI大模型在电力设备运维场景应用时涉及的需求分析、模型训练、应用部署、运营管理等主要阶段的实现过程,进而提出了持续监控并优化数据质量、采用持续学习算法、建立模型性能反馈循环机制等大模型性能持续优化策略。进一步探讨了多模态AI大模型赋能电力设备运维的应用趋势和发展保障举措,以深化对电力设备智能运维领域的前沿技术认知,推动构建智能化、智慧化的新型电力系统。 展开更多
关键词 新型电力系统 电力设备运维 多模态AI大模型 检索增强生成 知识图谱
在线阅读 下载PDF
中医古籍方剂数据挖掘与知识问答系统构建 被引量:2
15
作者 李明 罗晓兰 朱邦贤 《图书馆论坛》 北大核心 2025年第4期49-59,共11页
文章以《伤寒论》等中医古籍为数据来源,结合古籍的目录结构,通过ChatGLM提取古籍中的方剂信息,存入MySQL关系型数据库,构建中医古籍方剂检索系统;通过ChatGLM对方剂信息进行解析,利用Apriori、association_rules、community_louvain等... 文章以《伤寒论》等中医古籍为数据来源,结合古籍的目录结构,通过ChatGLM提取古籍中的方剂信息,存入MySQL关系型数据库,构建中医古籍方剂检索系统;通过ChatGLM对方剂信息进行解析,利用Apriori、association_rules、community_louvain等数据挖掘算法,以及Echart、Pyvis等知识图谱工具,实现中医古籍挖掘及知识图谱可视化展示,构建基于LLM的中医古籍方剂数据挖掘系统;以BISHENG平台为工具,以抽取方剂信息为来源,构建基于检索增强生成的中医古籍方剂知识问答系统。研究结果表明:本研究方法提取中医古籍方剂名的召回率为99.19%-100%;除《医学衷中参西录·方剂篇》外,方剂组成、主治、用法抽取准确性的ROUGE-L值为84.29%-97.78%;中药名和剂量识别的准确率大于98.00%,主治解析准确率大于86.00%;数据挖掘结果与已有古籍研究成果相符;知识问答结果符合预期。 展开更多
关键词 大语言模型 检索增强生成 数据挖掘 知识问答 中医古籍
在线阅读 下载PDF
从RAG到SAGE:现状与展望 被引量:1
16
作者 田永林 王雨桐 +9 位作者 王兴霞 杨静 沈甜雨 王建功 范丽丽 郭超 王寿文 赵勇 武万森 王飞跃 《自动化学报》 北大核心 2025年第6期1145-1169,共25页
大模型技术的兴起显著提升了人们获取和利用知识的效率,但在实际应用中仍然面临着知识受限、迁移障碍和幻觉等挑战,阻碍了可信可靠人工智能系统的构建.检索增强生成(RAG)通过利用外接知识库和查询关联的检索有效增强大模型的能力水平,... 大模型技术的兴起显著提升了人们获取和利用知识的效率,但在实际应用中仍然面临着知识受限、迁移障碍和幻觉等挑战,阻碍了可信可靠人工智能系统的构建.检索增强生成(RAG)通过利用外接知识库和查询关联的检索有效增强大模型的能力水平,为大模型掌握实时型、行业型及私有型知识提供有力支撑,进而促进大模型技术向多样场景的快速推广和实施.围绕RAG,阐述其基本原理、发展现状及典型应用,并分析其优势和面临的挑战.在RAG的基础上,通过结合搜索模块和多级缓存管理模块,提出RAG的拓展框架SAGE,以建立更加灵活和高效的大模型知识外挂工具链. 展开更多
关键词 大模型 检索增强生成 基础智能 知识自动化
在线阅读 下载PDF
基于JRAG的涉水法律法规智能知识问答技术 被引量:1
17
作者 张志鑫 明晨曦 +3 位作者 刘颉 刘哲 李岸昀 曾德晶 《人民长江》 北大核心 2025年第2期240-247,共8页
当前以自然语言大模型为代表的生成式人工智能技术迎来了蓬勃发展,为涉水法律法规领域的智能知识问答提供了新的思路。然而,现有的大模型主要是在通用数据集上训练的,在涉水法律法规领域上的知识问答容易出现回答内容相关度较低、回答... 当前以自然语言大模型为代表的生成式人工智能技术迎来了蓬勃发展,为涉水法律法规领域的智能知识问答提供了新的思路。然而,现有的大模型主要是在通用数据集上训练的,在涉水法律法规领域上的知识问答容易出现回答内容相关度较低、回答不准确等问题。对此,提出了基于联合检索增强生成(JRAG)的涉水法律法规智能知识问答技术框架,该方法主要由知识存储、知识检索以及问答生成等环节组成。为了提高知识检索的效果,在知识检索环节提出词向量-关键词联合检索的方法,有效地提高了检索内容与用户问题匹配的能力。为了验证JRAG的有效性,提出了一套涉水法律法规问答数据集。在该数据集上与最新中文大模型,如文心一言、通义千问、Yi、ChatGLM3等进行对比,JRAG在评估指标真实性、完整性、相关性和有效性上取得了更好的效果。研究成果具有一定的扩展性,可为其他业务领域的智能知识问答研究奠定基础。 展开更多
关键词 大模型 知识问答 涉水法律法规 联合检索增强生成 词向量
在线阅读 下载PDF
基于迁移知识的跨模态双重哈希 被引量:1
18
作者 钟建奇 林秋斌 曹文明 《电子学报》 北大核心 2025年第1期209-220,共12页
随着社交网络的普及和多媒体数据的急剧增长,有效的跨模态检索引起了人们越来越多的关注.由于哈希有效的检索效率和低存储成本,其被广泛用于跨模态检索任务中.然而,这些基于深度学习的跨模态哈希检索方法大多数是利用图像网络和文本网... 随着社交网络的普及和多媒体数据的急剧增长,有效的跨模态检索引起了人们越来越多的关注.由于哈希有效的检索效率和低存储成本,其被广泛用于跨模态检索任务中.然而,这些基于深度学习的跨模态哈希检索方法大多数是利用图像网络和文本网络各自生成对应模态的哈希码,难以获得更加有效的哈希码,无法进一步减小不同模态数据之间的模态鸿沟.为了更好地提高跨模态哈希检索的性能,本文提出了一种基于迁移知识的跨模态双重哈希(Cross-modal Dual Hashing based on Transfer Knowledge,CDHTK).CDHTK通过结合图像网络、知识迁移网络以及文本网络进行跨模态哈希检索任务.对于图像模态,CDHTK融合图像网络和知识迁移网络各自生成的哈希码,进而生成具有判别性的图像哈希码;对于文本模态,CDHTK融合文本网络和知识迁移网络各自生成的哈希码,从而生成有效的文本哈希码.CDHTK通过采用预测标签的交叉熵损失、生成哈希码的联合三元组量化损失以及迁移知识的差分损失来共同优化哈希码的生成过程,从而提高模型的检索效果,在2个常用的数据集(IAPR TC-12,MIR-Flickr 25K)上进行的实验验证了CDHTK的有效性,比当前最先进的跨模态哈希方法(Adaptive Label correlation based asymm Etric Cross-modal Hashing,ALECH)分别高出6.82%和5.13%. 展开更多
关键词 跨模态 图像-文本检索 双重哈希 迁移知识
在线阅读 下载PDF
重新审视代码补全中的检索增强策略 被引量:1
19
作者 邹佰翰 汪莹 +5 位作者 彭鑫 娄一翎 刘力华 张昕东 林帆 刘名威 《软件学报》 北大核心 2025年第6期2747-2773,共27页
软件开发者在编写代码时,常常会参考项目中实现了相似功能的代码.代码生成模型在生成代码时也具有类似特点,会以输入中给出的代码上下文信息作为参考.基于检索增强的代码补全技术与这一思想类似,该技术从检索库中检索到外部代码作为额... 软件开发者在编写代码时,常常会参考项目中实现了相似功能的代码.代码生成模型在生成代码时也具有类似特点,会以输入中给出的代码上下文信息作为参考.基于检索增强的代码补全技术与这一思想类似,该技术从检索库中检索到外部代码作为额外信息,对生成模型起到提示的作用,从而生成目标代码.现有的基于检索增强的代码补全方法将输入代码和检索结果直接拼接到一起作为生成模型的输入,这种方法带来了一个风险,即检索到的代码片段可能并不能对模型起到提示作用,反而有可能会误导模型,导致生成的代码结果不准确.此外,由于无论检索到的外部代码是否与输入代码完全相关,都会被与输入代码拼接起来输入到模型,这导致该方法的效果在很大程度上依赖于代码检索阶段的准确性.如果检索阶段不能返回可用的代码片段,那么后续的代码补全效果可能也会受到影响.首先,针对现有的代码补全方法中的检索增强策略进行了经验研究,通过定性和定量实验分析检索增强的各个阶段对于代码补全效果的影响,在经验研究中重点识别了代码粒度、代码检索方法、代码后处理方法这3种影响检索增强效果的因素.接着,基于经验研究的结论设计改进方法,提出一种通过分阶段优化代码检索策略来改进检索增强的代码补全方法MAGIC(multi-stage optimization for retrieval augmented code completion),设计了代码切分、二次检索精排、模板提示生成等改进策略,可以有效地提升检索增强对代码补全模型的辅助生成作用,并减少模型在代码生成阶段受到的噪声干扰,提升生成代码的质量.最后,在Java代码数据集上的实验结果表明:与现有的基于检索增强的代码补全方法相比,该方法在编辑相似度和完全匹配指标上分别提升了6.76%和7.81%.与6B参数量的代码大模型相比,该方法能够在节省94.5%的显存和73.8%的推理时间的前提下,在编辑相似度和完全匹配指标上分别提升5.62%和4.66%. 展开更多
关键词 检索增强 大语言模型 代码补全 提示学习 多阶段优化
在线阅读 下载PDF
基于目标语义提示与双注意力感知的遥感图像文本检索方法
20
作者 田澍 张秉熙 +5 位作者 曹林 邢相薇 田菁 沈博 杜康宁 张晔 《电子与信息学报》 北大核心 2025年第6期1734-1746,共13页
高分辨率遥感图像场景复杂、语义信息丰富多样且目标尺度多变,容易引起特征空间中不同类别目标的图像特征分布混淆,导致模型难以高效捕获遥感目标文本语义与图像特征的潜在关联,进而影响遥感图像文本检索的精度。针对这一问题,该文提出... 高分辨率遥感图像场景复杂、语义信息丰富多样且目标尺度多变,容易引起特征空间中不同类别目标的图像特征分布混淆,导致模型难以高效捕获遥感目标文本语义与图像特征的潜在关联,进而影响遥感图像文本检索的精度。针对这一问题,该文提出基于目标语义提示与双注意力感知的遥感图像文本检索方法。该方法首先引入空间-通道协同注意力,利用空间-通道维度注意权重交互捕捉图像全局上下文特征。同时,为了实现遥感图像显著目标信息的多粒度精准表征,模型通过所构建的基于自适应显著性区域目标感知注意力机制,通过动态多尺度目标特征加权聚合,提升对目标局部区域显著性特征聚焦响应。此外,该文设计了目标类别概率先验引导策略,对文本描述进行目标类别语义词频统计,以获取高概率先验目标语义信息,进而指导在跨模态共性嵌入空间中的图像特征聚类,最终实现高效准确的图像-文本特征对齐。该方法在RSICD与RSITMD两组遥感图像文本检索基准数据集上开展实验评估。结果表明,所设计的方法在检索精度指标上展现出了卓越的性能优势。 展开更多
关键词 遥感图像 跨模态 图像文本检索 CLIP 空间通道注意力
在线阅读 下载PDF
上一页 1 2 63 下一页 到第
使用帮助 返回顶部