期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于思维链的大语言模型知识蒸馏 被引量:13
1
作者 李荣涵 浦荣成 +2 位作者 沈佳楠 李栋栋 苗启广 《数据采集与处理》 CSCD 北大核心 2024年第3期547-558,共12页
思维链(Chain of thought,CoT)提示使大语言模型能够按照具体推理步骤处理复杂的任务,让大语言模型在常识推理、数学逻辑推理和可解释性等方面表现出更强的能力。然而,CoT方法的主要缺点在于其对庞大语言模型的依赖,这些模型通常拥有数... 思维链(Chain of thought,CoT)提示使大语言模型能够按照具体推理步骤处理复杂的任务,让大语言模型在常识推理、数学逻辑推理和可解释性等方面表现出更强的能力。然而,CoT方法的主要缺点在于其对庞大语言模型的依赖,这些模型通常拥有数百亿的参数,在大规模部署方面面临挑战。为此,本文提出一种基于思维链的大模型知识蒸馏方法,主要目标在于充分利用大型语言模型的思维推理能力,通过知识蒸馏技术,引导小模型解决复杂任务。以大型模型为教师模型,小型模型为学生模型,通过获取教师模型的推理数据来微调学生模型。通过更改数据生成方式、基于聚类的问答示例采样、示例启发式纠错以及答案的自适应生成等一系列精心设计的方法,使教师模型的生成过程更高效,生成的推理数据质量更高、数量更多,从而更好地微调学生模型,使其获得强大的推理能力,实现高效的知识蒸馏。这一研究框架旨在建立一个有效的知识传递机制,使得大模型的深度思考能够有效指导小模型,为解决复杂任务提供更为智能且高效的解决方案。通过这种方式,希望能够克服大模型部署的挑战,并促进语言模型在现实世界中的应用和进步。 展开更多
关键词 思维链 逻辑推理 知识蒸馏 微调
在线阅读 下载PDF
大模型技术的军事应用综述 被引量:7
2
作者 高志强 沈佳楠 +2 位作者 姬纬通 袁梦 崔翛龙 《南京航空航天大学学报》 CAS CSCD 北大核心 2024年第5期801-814,共14页
大模型以强大的自然语言理解、逻辑推理和内容生成等能力,为军事智能发展带来了前所未有的机遇和挑战。本文梳理了大语言模型的架构建模、适配微调、提示学习等技术,以及典型多模态大模型技术的发展现状,深度分析了国内外主流大模型军... 大模型以强大的自然语言理解、逻辑推理和内容生成等能力,为军事智能发展带来了前所未有的机遇和挑战。本文梳理了大语言模型的架构建模、适配微调、提示学习等技术,以及典型多模态大模型技术的发展现状,深度分析了国内外主流大模型军事应用平台特点,设计了大模型军事应用的典型任务场景和能力需求,探讨了大模型技术军事应用面临的挑战,展望了军事领域大模型应用的共性关键技术发展,以期为提升基于大模型技术的重大军事应用设计与实战研究提供参考。 展开更多
关键词 大模型 军事应用 指挥控制 军事智能 人在回路
在线阅读 下载PDF
“艾武大模型+”:一种军事大模型系统的开发与实证 被引量:3
3
作者 崔翛龙 高志强 +3 位作者 姬纬通 沈佳楠 张敏 邱鑫源 《数据采集与处理》 CSCD 北大核心 2024年第3期588-597,共10页
智能化指挥是新型指挥控制理论研究的重要方向,大模型是智能交互、任务规划和辅助决策等智能化指挥能力实现的重要支撑。本文兼顾理论与实践,梳理大模型军事能力需求,设计面向智能化指挥的大模型应用框架,提出“艾武大模型+”的系统架... 智能化指挥是新型指挥控制理论研究的重要方向,大模型是智能交互、任务规划和辅助决策等智能化指挥能力实现的重要支撑。本文兼顾理论与实践,梳理大模型军事能力需求,设计面向智能化指挥的大模型应用框架,提出“艾武大模型+”的系统架构、信息流程和协同架构,梳理工程实现的关键技术,以智能化指挥实证案例及选型分析验证“艾武大模型+”系统在多模态交互和特定任务军语理解的能力优势,拓展有/无人平台的末端协同和指令控制,为重大国防军事专项、智能化指挥研究与落地应用提供参考。 展开更多
关键词 军事大模型 提示工程 智能化指挥 专用语料 多模态交互
在线阅读 下载PDF
基于大模型的联动处置多智能代理协同框架 被引量:3
4
作者 吴晓宁 李瑞欣 +5 位作者 王浪 刘文杰 王宏伟 朱新立 宋江帆 袁梦 《数据采集与处理》 CSCD 北大核心 2024年第3期559-576,共18页
针对指挥员应对重大突发情况时的处置决策难题,提出一种基于大模型的联动处置多智能代理协同框架。该框架通过智能代理角色生成、多层级蒙特卡洛树与交互式提示学习等策略,优化群体决策效率与动作规划,同时引入分层机制与工作流管理理念... 针对指挥员应对重大突发情况时的处置决策难题,提出一种基于大模型的联动处置多智能代理协同框架。该框架通过智能代理角色生成、多层级蒙特卡洛树与交互式提示学习等策略,优化群体决策效率与动作规划,同时引入分层机制与工作流管理理念,通过强化学习奖励函数共享提升协同效率,设计显式与隐式通信模式确保节点状态一致。实验表明,该框架在多种场景下表现优异,与传统任务分配手段相比,大大提高了面对突发事件时的反应速度和处置效率。 展开更多
关键词 大模型 联动处置 多智能代理 处置规划
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部