检索结果-维普期刊中文期刊服务平台

基于思维链的大语言模型知识蒸馏被引量：13: 1; 作者李荣涵浦荣成 +2 位作者沈佳楠李栋栋苗启广《数据采集与处理》 CSCD 北大核心 2024年第3期547-558,共12页; 思维链(Chain of thought,CoT)提示使大语言模型能够按照具体推理步骤处理复杂的任务,让大语言模型在常识推理、数学逻辑推理和可解释性等方面表现出更强的能力。然而,CoT方法的主要缺点在于其对庞大语言模型的依赖,这些模型通常拥有数... 展开更多; 关键词思维链逻辑推理知识蒸馏微调; 在线阅读下载PDF 职称材料

大模型技术的军事应用综述被引量：7: 2; 作者高志强沈佳楠 +2 位作者姬纬通袁梦崔翛龙《南京航空航天大学学报》 CAS CSCD 北大核心 2024年第5期801-814,共14页; 大模型以强大的自然语言理解、逻辑推理和内容生成等能力,为军事智能发展带来了前所未有的机遇和挑战。本文梳理了大语言模型的架构建模、适配微调、提示学习等技术,以及典型多模态大模型技术的发展现状,深度分析了国内外主流大模型军... 展开更多; 关键词大模型军事应用指挥控制军事智能人在回路; 在线阅读下载PDF 职称材料

“艾武大模型+”:一种军事大模型系统的开发与实证被引量：3: 3; 作者崔翛龙高志强 +3 位作者姬纬通沈佳楠张敏邱鑫源《数据采集与处理》 CSCD 北大核心 2024年第3期588-597,共10页; 智能化指挥是新型指挥控制理论研究的重要方向,大模型是智能交互、任务规划和辅助决策等智能化指挥能力实现的重要支撑。本文兼顾理论与实践,梳理大模型军事能力需求,设计面向智能化指挥的大模型应用框架,提出“艾武大模型+”的系统架... 展开更多; 关键词军事大模型提示工程智能化指挥专用语料多模态交互; 在线阅读下载PDF 职称材料

基于大模型的联动处置多智能代理协同框架被引量：3: 4; 作者吴晓宁李瑞欣 +5 位作者王浪刘文杰王宏伟朱新立宋江帆袁梦《数据采集与处理》 CSCD 北大核心 2024年第3期559-576,共18页; 针对指挥员应对重大突发情况时的处置决策难题,提出一种基于大模型的联动处置多智能代理协同框架。该框架通过智能代理角色生成、多层级蒙特卡洛树与交互式提示学习等策略,优化群体决策效率与动作规划,同时引入分层机制与工作流管理理念... 展开更多; 关键词大模型联动处置多智能代理处置规划; 在线阅读下载PDF 职称材料

题名基于思维链的大语言模型知识蒸馏被引量：13: 1; 作者李荣涵浦荣成沈佳楠李栋栋苗启广; 机构西安电子科技大学计算机科学与技术学院武警工程大学反恐指挥信息工程教育部重点实验室(立项); 出处《数据采集与处理》 CSCD 北大核心 2024年第3期547-558,共12页; 文摘思维链(Chain of thought,CoT)提示使大语言模型能够按照具体推理步骤处理复杂的任务,让大语言模型在常识推理、数学逻辑推理和可解释性等方面表现出更强的能力。然而,CoT方法的主要缺点在于其对庞大语言模型的依赖,这些模型通常拥有数百亿的参数,在大规模部署方面面临挑战。为此,本文提出一种基于思维链的大模型知识蒸馏方法,主要目标在于充分利用大型语言模型的思维推理能力,通过知识蒸馏技术,引导小模型解决复杂任务。以大型模型为教师模型,小型模型为学生模型,通过获取教师模型的推理数据来微调学生模型。通过更改数据生成方式、基于聚类的问答示例采样、示例启发式纠错以及答案的自适应生成等一系列精心设计的方法,使教师模型的生成过程更高效,生成的推理数据质量更高、数量更多,从而更好地微调学生模型,使其获得强大的推理能力,实现高效的知识蒸馏。这一研究框架旨在建立一个有效的知识传递机制,使得大模型的深度思考能够有效指导小模型,为解决复杂任务提供更为智能且高效的解决方案。通过这种方式,希望能够克服大模型部署的挑战,并促进语言模型在现实世界中的应用和进步。; 关键词思维链逻辑推理知识蒸馏微调; Keywords chain of thought logical reasoning knowledge distillation fine-tuning; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名大模型技术的军事应用综述被引量：7: 2; 作者高志强沈佳楠姬纬通袁梦崔翛龙; 机构武警工程大学反恐指挥信息工程教育部重点实验室(立项); 出处《南京航空航天大学学报》 CAS CSCD 北大核心 2024年第5期801-814,共14页; 基金国家社会科学基金(2022-SKJJ-C-093) 武警部队科技创新团队创新研究项目(ZZKY20222103)。; 文摘大模型以强大的自然语言理解、逻辑推理和内容生成等能力,为军事智能发展带来了前所未有的机遇和挑战。本文梳理了大语言模型的架构建模、适配微调、提示学习等技术,以及典型多模态大模型技术的发展现状,深度分析了国内外主流大模型军事应用平台特点,设计了大模型军事应用的典型任务场景和能力需求,探讨了大模型技术军事应用面临的挑战,展望了军事领域大模型应用的共性关键技术发展,以期为提升基于大模型技术的重大军事应用设计与实战研究提供参考。; 关键词大模型军事应用指挥控制军事智能人在回路; Keywords foundation model military application command and control military intelligence human in the loop; 分类号 TP18 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名“艾武大模型+”:一种军事大模型系统的开发与实证被引量：3: 3; 作者崔翛龙高志强姬纬通沈佳楠张敏邱鑫源; 机构武警工程大学反恐指挥信息工程教育部重点实验室(立项); 出处《数据采集与处理》 CSCD 北大核心 2024年第3期588-597,共10页; 基金国家社会科学基金(2022-SKJJ-C-093) 武警部队科技创新团队创新研究项目(ZZKY20222103)。; 文摘智能化指挥是新型指挥控制理论研究的重要方向,大模型是智能交互、任务规划和辅助决策等智能化指挥能力实现的重要支撑。本文兼顾理论与实践,梳理大模型军事能力需求,设计面向智能化指挥的大模型应用框架,提出“艾武大模型+”的系统架构、信息流程和协同架构,梳理工程实现的关键技术,以智能化指挥实证案例及选型分析验证“艾武大模型+”系统在多模态交互和特定任务军语理解的能力优势,拓展有/无人平台的末端协同和指令控制,为重大国防军事专项、智能化指挥研究与落地应用提供参考。; 关键词军事大模型提示工程智能化指挥专用语料多模态交互; Keywords military large model prompt engineering intelligent command specialized corpus multimodal interaction; 分类号 TP18 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名基于大模型的联动处置多智能代理协同框架被引量：3: 4; 作者吴晓宁李瑞欣王浪刘文杰王宏伟朱新立宋江帆袁梦; 机构北方自动控制技术研究所武警工程大学反恐指挥信息工程教育部重点实验室(立项); 出处《数据采集与处理》 CSCD 北大核心 2024年第3期559-576,共18页; 基金山西省重点研发计划(202102150401013)。; 文摘针对指挥员应对重大突发情况时的处置决策难题,提出一种基于大模型的联动处置多智能代理协同框架。该框架通过智能代理角色生成、多层级蒙特卡洛树与交互式提示学习等策略,优化群体决策效率与动作规划,同时引入分层机制与工作流管理理念,通过强化学习奖励函数共享提升协同效率,设计显式与隐式通信模式确保节点状态一致。实验表明,该框架在多种场景下表现优异,与传统任务分配手段相比,大大提高了面对突发事件时的反应速度和处置效率。; 关键词大模型联动处置多智能代理处置规划; Keywords large language models(LLMs) collaborative disposal multi-intelligence agent(MIA) disposal planning; 分类号 TP183 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于思维链的大语言模型知识蒸馏	李荣涵浦荣成沈佳楠李栋栋苗启广	《数据采集与处理》 CSCD 北大核心	2024	13	在线阅读下载PDF 职称材料
2	大模型技术的军事应用综述	高志强沈佳楠姬纬通袁梦崔翛龙	《南京航空航天大学学报》 CAS CSCD 北大核心	2024	7	在线阅读下载PDF 职称材料
3	“艾武大模型+”:一种军事大模型系统的开发与实证	崔翛龙高志强姬纬通沈佳楠张敏邱鑫源	《数据采集与处理》 CSCD 北大核心	2024	3	在线阅读下载PDF 职称材料
4	基于大模型的联动处置多智能代理协同框架	吴晓宁李瑞欣王浪刘文杰王宏伟朱新立宋江帆袁梦	《数据采集与处理》 CSCD 北大核心	2024	3	在线阅读下载PDF 职称材料